yanyiwu
|
8eef9a13a8
|
fix bug about optional argument hmm
|
2015-09-13 18:06:44 +08:00 |
|
yanyiwu
|
f98e94869c
|
add optional argument: hmm
|
2015-09-13 17:28:49 +08:00 |
|
yanyiwu
|
14974d51b4
|
abondom ISegment
|
2015-09-13 17:02:04 +08:00 |
|
yanyiwu
|
6d69363145
|
refactor, simplify SegmentBase
|
2015-09-13 16:29:35 +08:00 |
|
yanyiwu
|
e9241d9025
|
fixed the bug in the last commit
|
2015-09-13 16:18:48 +08:00 |
|
yanyiwu
|
28bcb3bf57
|
use PreFilter in SegmentBase
|
2015-09-13 16:05:17 +08:00 |
|
yanyiwu
|
0542dd1cfd
|
add PreFilter
|
2015-09-13 15:10:10 +08:00 |
|
yanyiwu
|
710ddacd38
|
add Jieba.hpp
|
2015-09-13 00:28:40 +08:00 |
|
yanyiwu
|
19bb124b3e
|
[enhancement issue]: https://github.com/yanyiwu/nodejieba/issues/39
|
2015-09-11 17:30:23 +08:00 |
|
yanyiwu
|
1babe57ebc
|
细粒度分词功能
|
2015-08-30 16:35:21 +08:00 |
|
yanyiwu
|
3c60c35906
|
修复FullSegment对于有些单字没有输出的bug
|
2015-08-30 13:09:37 +08:00 |
|
yanyiwu
|
001a69d8c6
|
增加MPSegment的细粒度分词功能。
|
2015-08-30 01:04:30 +08:00 |
|
yanyiwu
|
fae951a95d
|
统一私有函数的命名风格
|
2015-08-28 11:17:38 +08:00 |
|
yanyiwu
|
0e0318f6ad
|
集成LevelSegment进Application
|
2015-08-11 11:57:58 +08:00 |
|
yanyiwu
|
41e4300c9a
|
LevelSegment
|
2015-08-11 00:53:06 +08:00 |
|
yanyiwu
|
efd029c20b
|
namespace husky; namespace limonp;
|
2015-08-08 12:30:14 +08:00 |
|
yanyiwu
|
8a3ced2b27
|
去掉一些没必要的返回值判断,精简代码
|
2015-07-24 14:39:03 +08:00 |
|
yanyiwu
|
0f79fa6c24
|
统一在SegmentBase搞定所有Unicode和string的转码事情
|
2015-07-24 13:42:24 +08:00 |
|
yanyiwu
|
4d86abb001
|
新增findByLimit函数
|
2015-07-23 21:10:56 +08:00 |
|
yanyiwu
|
78e41e5fd0
|
规范Unicode的相关命名,使用Rune代表一个中文字符
|
2015-07-21 14:54:50 +08:00 |
|
yanyiwu
|
0e16e000ea
|
解决一些历史遗留问题
|
2015-07-21 14:32:05 +08:00 |
|
yanyiwu
|
620d276887
|
底层常用结构修整
|
2015-07-21 12:11:43 +08:00 |
|
aholic
|
f5e74a3f46
|
replace old trie
|
2015-07-21 00:29:49 +08:00 |
|
aholic
|
f5d824043c
|
Merge branch 'master' of https://github.com/aholic/cppjieba
|
2015-07-21 00:17:02 +08:00 |
|
aholic
|
791ee25295
|
pull upstream
|
2015-07-21 00:16:49 +08:00 |
|
xuangong
|
cf9cc45c19
|
astyle
|
2015-07-21 00:11:13 +08:00 |
|
xuangong
|
931db7d1e5
|
astyle
|
2015-07-20 23:54:20 +08:00 |
|
yanyiwu
|
64d073d194
|
支持insertUserWord接口
|
2015-06-27 11:39:43 +08:00 |
|
yanyiwu
|
c5f7d4d670
|
重构trie前先ci一下
|
2015-06-26 14:29:44 +08:00 |
|
yanyiwu
|
e0db070529
|
开放insertUserWord接口;增加cut的默认参数,默认切词算法为Mix
|
2015-06-26 12:22:11 +08:00 |
|
yanyiwu
|
1d27559209
|
refactor DictTrie, and expose function: insertUserWord
|
2015-06-26 11:49:35 +08:00 |
|
yanyiwu
|
389914ae1b
|
修复部分代码在 windows 上编译不通过的问题,提升兼容性。
|
2015-06-09 15:31:43 +08:00 |
|
yanyiwu
|
e3c57c0ba1
|
提升兼容性,修复在某些特定环境下的编译错误问题。
|
2015-06-08 15:01:59 +08:00 |
|
yanyiwu
|
3528b6296a
|
修改 cjserver 服务,可以通过http参数使用不同切词算法进行切词。
修改 make install 的安装目录,统一安装到同一个目录 /usr/local/cppjieba
|
2015-06-05 21:59:16 +08:00 |
|
yanyiwu
|
a3d9b40c2a
|
修改QuerySegment的构造函数参数顺序
|
2015-06-05 16:23:51 +08:00 |
|
yanyiwu
|
45588b75cc
|
增加 Application 这个类,整合了所有CppJieba的功能进去,以后用户只需要使用这个类即可。
|
2015-06-05 16:00:32 +08:00 |
|
yanyiwu
|
d56bf2cc68
|
重构:增加让各个分词类的构造函数,为后面的憋大招做准备。
|
2015-06-04 22:38:55 +08:00 |
|
yanyiwu
|
b99d0698f0
|
将 HMMSegment 里面关于模型文件的数据独立成 HMMModel
|
2015-06-04 17:52:18 +08:00 |
|
yanyiwu
|
9218ccb9c9
|
set default argument in QuerySegment: size_t maxWordLen = 4
|
2015-06-04 14:37:09 +08:00 |
|
yanyiwu
|
aed1c8f4a6
|
删除一些无必要的错误检查
|
2015-05-21 16:04:41 +08:00 |
|
yanyiwu
|
6e3bb7d057
|
use reverse_iterator
|
2015-05-18 23:57:13 +08:00 |
|
yanyiwu
|
c04b2dd0d4
|
增加更详细的错误日志,在初始化过程中合理使用LogFatal。
|
2015-05-07 20:03:19 +08:00 |
|
yanyiwu
|
2b18a582fc
|
code style
|
2015-05-06 23:02:03 +08:00 |
|
yanyiwu
|
bb32234654
|
astyle --style=google --indent=spaces=2
|
2015-05-06 17:53:20 +08:00 |
|
yanyiwu
|
b70875f412
|
update LogFatal, print more readable error message when errors happened
|
2015-05-06 17:20:15 +08:00 |
|
aholic
|
d1a112c0c4
|
improve efficiency for trie tree in ugly way
|
2015-04-19 21:44:50 +08:00 |
|
aholic
|
ea0d464519
|
Merge https://github.com/yanyiwu/cppjieba
|
2015-03-19 22:57:04 +08:00 |
|
yanyiwu
|
5121bf675e
|
__APPLE__
|
2015-02-28 12:49:07 +08:00 |
|
qinwf
|
c0bdef74fb
|
添加英文+数字分词规则 qinwf/jiebaR#7
|
2015-02-06 10:19:43 +08:00 |
|
yanyiwu
|
10e9b32258
|
little adjustment
|
2015-01-31 12:58:49 +08:00 |
|