381 Commits

Author SHA1 Message Date
yanyiwu
f17c2d10e2 [code style] uppercase function name 2015-10-29 12:30:47 +08:00
yanyiwu
6f51373280 support optional user word freq weight 2015-10-09 11:20:06 +08:00
yanyiwu
ecacf118e6 [code style] lower case namespace 2015-10-08 21:13:11 +08:00
yanyiwu
16b69e35c1 delete Application.hpp, use Jieba.hpp instead 2015-10-08 21:03:09 +08:00
yanyiwu
4d56be920b support optional user word freq weight 2015-10-08 20:05:27 +08:00
yanyiwu
98345d6aed add SetStaticWordWeights UserWordWeightOption 2015-10-08 17:36:52 +08:00
yanyiwu
b28d6db574 code style 2015-10-08 17:08:57 +08:00
yanyiwu
9de513f1d5 new feature: loading multi user dict, path is split by : 2015-09-25 16:20:06 +08:00
yanyiwu
e55d0bf95c update limonp 2015-09-25 16:11:27 +08:00
yanyiwu
c70dcdd2a9 fix bug about header file including protection 2015-09-24 11:48:50 +08:00
yanyiwu
8eef9a13a8 fix bug about optional argument hmm 2015-09-13 18:06:44 +08:00
yanyiwu
f98e94869c add optional argument: hmm 2015-09-13 17:28:49 +08:00
yanyiwu
14974d51b4 abondom ISegment 2015-09-13 17:02:04 +08:00
yanyiwu
6d69363145 refactor, simplify SegmentBase 2015-09-13 16:29:35 +08:00
yanyiwu
e9241d9025 fixed the bug in the last commit 2015-09-13 16:18:48 +08:00
yanyiwu
28bcb3bf57 use PreFilter in SegmentBase 2015-09-13 16:05:17 +08:00
yanyiwu
0542dd1cfd add PreFilter 2015-09-13 15:10:10 +08:00
yanyiwu
710ddacd38 add Jieba.hpp 2015-09-13 00:28:40 +08:00
yanyiwu
19bb124b3e [enhancement issue]: https://github.com/yanyiwu/nodejieba/issues/39 2015-09-11 17:30:23 +08:00
yanyiwu
1babe57ebc 细粒度分词功能 2015-08-30 16:35:21 +08:00
yanyiwu
3c60c35906 修复FullSegment对于有些单字没有输出的bug 2015-08-30 13:09:37 +08:00
yanyiwu
001a69d8c6 增加MPSegment的细粒度分词功能。 2015-08-30 01:04:30 +08:00
yanyiwu
fae951a95d 统一私有函数的命名风格 2015-08-28 11:17:38 +08:00
yanyiwu
0e0318f6ad 集成LevelSegment进Application 2015-08-11 11:57:58 +08:00
yanyiwu
41e4300c9a LevelSegment 2015-08-11 00:53:06 +08:00
yanyiwu
efd029c20b namespace husky; namespace limonp; 2015-08-08 12:30:14 +08:00
yanyiwu
8a3ced2b27 去掉一些没必要的返回值判断,精简代码 2015-07-24 14:39:03 +08:00
yanyiwu
0f79fa6c24 统一在SegmentBase搞定所有Unicode和string的转码事情 2015-07-24 13:42:24 +08:00
yanyiwu
4d86abb001 新增findByLimit函数 2015-07-23 21:10:56 +08:00
yanyiwu
78e41e5fd0 规范Unicode的相关命名,使用Rune代表一个中文字符 2015-07-21 14:54:50 +08:00
yanyiwu
0e16e000ea 解决一些历史遗留问题 2015-07-21 14:32:05 +08:00
yanyiwu
620d276887 底层常用结构修整 2015-07-21 12:11:43 +08:00
aholic
f5e74a3f46 replace old trie 2015-07-21 00:29:49 +08:00
aholic
f5d824043c Merge branch 'master' of https://github.com/aholic/cppjieba 2015-07-21 00:17:02 +08:00
aholic
791ee25295 pull upstream 2015-07-21 00:16:49 +08:00
xuangong
cf9cc45c19 astyle 2015-07-21 00:11:13 +08:00
xuangong
931db7d1e5 astyle 2015-07-20 23:54:20 +08:00
yanyiwu
64d073d194 支持insertUserWord接口 2015-06-27 11:39:43 +08:00
yanyiwu
c5f7d4d670 重构trie前先ci一下 2015-06-26 14:29:44 +08:00
yanyiwu
e0db070529 开放insertUserWord接口;增加cut的默认参数,默认切词算法为Mix 2015-06-26 12:22:11 +08:00
yanyiwu
1d27559209 refactor DictTrie, and expose function: insertUserWord 2015-06-26 11:49:35 +08:00
yanyiwu
389914ae1b 修复部分代码在 windows 上编译不通过的问题,提升兼容性。 2015-06-09 15:31:43 +08:00
yanyiwu
e3c57c0ba1 提升兼容性,修复在某些特定环境下的编译错误问题。 2015-06-08 15:01:59 +08:00
yanyiwu
3528b6296a 修改 cjserver 服务,可以通过http参数使用不同切词算法进行切词。
修改 make install 的安装目录,统一安装到同一个目录 /usr/local/cppjieba
2015-06-05 21:59:16 +08:00
yanyiwu
a3d9b40c2a 修改QuerySegment的构造函数参数顺序 2015-06-05 16:23:51 +08:00
yanyiwu
45588b75cc 增加 Application 这个类,整合了所有CppJieba的功能进去,以后用户只需要使用这个类即可。 2015-06-05 16:00:32 +08:00
yanyiwu
d56bf2cc68 重构:增加让各个分词类的构造函数,为后面的憋大招做准备。 2015-06-04 22:38:55 +08:00
yanyiwu
b99d0698f0 将 HMMSegment 里面关于模型文件的数据独立成 HMMModel 2015-06-04 17:52:18 +08:00
yanyiwu
9218ccb9c9 set default argument in QuerySegment: size_t maxWordLen = 4 2015-06-04 14:37:09 +08:00
yanyiwu
aed1c8f4a6 删除一些无必要的错误检查 2015-05-21 16:04:41 +08:00