137 Commits

Author SHA1 Message Date
yanyiwu
0e16e000ea 解决一些历史遗留问题 2015-07-21 14:32:05 +08:00
yanyiwu
620d276887 底层常用结构修整 2015-07-21 12:11:43 +08:00
yanyiwu
2ae6eba3a7 更新insertUserWord的示例程序 2015-06-27 13:16:25 +08:00
yanyiwu
d33c09d74a 增加单元测试 2015-06-27 12:34:27 +08:00
yanyiwu
64d073d194 支持insertUserWord接口 2015-06-27 11:39:43 +08:00
yanyiwu
c5f7d4d670 重构trie前先ci一下 2015-06-26 14:29:44 +08:00
yanyiwu
e0db070529 开放insertUserWord接口;增加cut的默认参数,默认切词算法为Mix 2015-06-26 12:22:11 +08:00
yanyiwu
67cc5941be update demo 2015-06-07 11:13:33 +08:00
yanyiwu
3528b6296a 修改 cjserver 服务,可以通过http参数使用不同切词算法进行切词。
修改 make install 的安装目录,统一安装到同一个目录 /usr/local/cppjieba
2015-06-05 21:59:16 +08:00
yanyiwu
8ce2af9706 更新Demo示例文件,demo只使用一个Application实例即可。 2015-06-05 18:12:27 +08:00
yanyiwu
e5d1ac7bc8 把dict/{extra_dict,gbk_dict} 挪进 test/testdata 2015-06-05 16:31:43 +08:00
yanyiwu
a3d9b40c2a 修改QuerySegment的构造函数参数顺序 2015-06-05 16:23:51 +08:00
yanyiwu
45588b75cc 增加 Application 这个类,整合了所有CppJieba的功能进去,以后用户只需要使用这个类即可。 2015-06-05 16:00:32 +08:00
yanyiwu
c04b2dd0d4 增加更详细的错误日志,在初始化过程中合理使用LogFatal。 2015-05-07 20:03:19 +08:00
yanyiwu
bb32234654 astyle --style=google --indent=spaces=2 2015-05-06 17:53:20 +08:00
yanyiwu
b3d928a450 rename aszxqw -> yanyiwu 2015-02-11 17:11:37 +08:00
qinwf
c0bdef74fb 添加英文+数字分词规则 qinwf/jiebaR#7 2015-02-06 10:19:43 +08:00
yanyiwu
660cd9d93e upload limonp for Colors.hpp and use ColorPrintln in load_test.cpp 2015-01-28 21:27:46 +08:00
yanyiwu
2488738b55 update unittest 2015-01-24 15:51:24 +08:00
yanyiwu
4e72d4a06f KeywordExtractor 支持自定义词典(可选参数)。 2015-01-24 15:34:34 +08:00
yanyiwu
269bc0fd0d make QuerySegment support user.dict.utf8 2015-01-23 01:10:12 +08:00
wyy
e9cbec02c2 增加两条词性标注的规则,针对连续英文和数字。 2014-11-29 12:45:11 +08:00
wyy
c119dc0a93 use localvector in dag 2014-11-12 21:18:30 +08:00
wyy
3ced451212 use automation 2014-11-12 18:55:17 +08:00
wyy
b9736ee132 update trie and dag , make cut faster . see details in changelog.md 2014-11-05 15:31:09 +08:00
wyy
11b041ed52 make load_test test time longer 2014-11-05 14:57:34 +08:00
wyy
471a68e08e 增加测试 2014-11-03 11:30:45 +08:00
wyy
107638f7d8 修改测试数据等 2014-11-03 11:19:00 +08:00
wyy
fbae0f6075 增加两条分词规则 2014-11-03 10:54:53 +08:00
wyy
b68a76e63a 完善一些测试 2014-10-26 12:21:10 +08:00
wyy
020aeaeeb0 update tagging_demo.cpp 2014-09-28 14:13:02 +08:00
wyy
6a8ebae344 支持自定义词性 2014-09-28 13:22:37 +08:00
wyy
28246fba5d 去除 PosTagger 构造函数里一些暂时无用的参数,和增加 PosTagger 的单元测试。 2014-09-28 11:59:30 +08:00
wyy
eb113acfbe update test/servertest 2014-09-15 22:21:37 +08:00
wyy
fbbcfbdec7 update limonp and husky for threadpool using 2014-09-15 17:52:33 +08:00
wyy
4d686edb7f update unittest for compiling ok in mac 2014-08-15 22:30:52 +08:00
wyy
9571a4d0d5 remove InitOnOff to make code lighter 2014-08-12 00:34:37 +08:00
wyy
8df0a1c89e fix max probability segmentor's bug : result is imcomplete while speical symbol in sentence 2014-07-08 23:38:06 -07:00
wyy
5b0ac64bc2 add unittest 2014-07-08 23:07:27 -07:00
wyy
fb608627c9 update limonp 2014-05-26 17:15:52 +08:00
wyy
bc6ed2368d use vector's reserve 2014-05-24 15:37:31 +08:00
wyy
f0a0731b74 add server.conf into testdata for testing 2014-05-17 21:20:09 -05:00
wyy
5b654f66db make single one chinese word in userdict will not be ignored in mixsegment.hpp 2014-05-17 16:22:54 +08:00
wyy
57ef504d9b modify test/segment_demo.cpp 2014-04-25 22:09:55 +08:00
wyy
94ae4bdd6f rm unused server in test 2014-04-25 21:21:05 +08:00
wyy
3e0aaf73a5 adding user dict interface and test ok 2014-04-25 19:30:26 +08:00
wyy
566187a49c add userdict.utf8 2014-04-25 19:22:32 +08:00
wyy
2937985243 adding user dict interface 2014-04-25 18:47:22 +08:00
wyy
dc96bb3795 add userdict loader 2014-04-25 17:29:42 +08:00
wyy
be3773920a modify keyword_demo 2014-04-20 00:23:42 +08:00