yanyiwu
|
6d69363145
|
refactor, simplify SegmentBase
|
2015-09-13 16:29:35 +08:00 |
|
yanyiwu
|
e9241d9025
|
fixed the bug in the last commit
|
2015-09-13 16:18:48 +08:00 |
|
yanyiwu
|
28bcb3bf57
|
use PreFilter in SegmentBase
|
2015-09-13 16:05:17 +08:00 |
|
yanyiwu
|
0542dd1cfd
|
add PreFilter
|
2015-09-13 15:10:10 +08:00 |
|
yanyiwu
|
710ddacd38
|
add Jieba.hpp
|
2015-09-13 00:28:40 +08:00 |
|
yanyiwu
|
63ca914176
|
update before_install for mac
|
2015-09-11 18:08:21 +08:00 |
|
yanyiwu
|
0ffc0f8079
|
make test
|
2015-09-11 18:06:58 +08:00 |
|
yanyiwu
|
19bb124b3e
|
[enhancement issue]: https://github.com/yanyiwu/nodejieba/issues/39
|
2015-09-11 17:30:23 +08:00 |
|
yanyiwu
|
1babe57ebc
|
细粒度分词功能
|
2015-08-30 16:35:21 +08:00 |
|
yanyiwu
|
3c60c35906
|
修复FullSegment对于有些单字没有输出的bug
|
2015-08-30 13:09:37 +08:00 |
|
yanyiwu
|
001a69d8c6
|
增加MPSegment的细粒度分词功能。
|
2015-08-30 01:04:30 +08:00 |
|
yanyiwu
|
fae951a95d
|
统一私有函数的命名风格
|
2015-08-28 11:17:38 +08:00 |
|
yanyiwu
|
0e0318f6ad
|
集成LevelSegment进Application
|
2015-08-11 11:57:58 +08:00 |
|
yanyiwu
|
0a6b01c374
|
update chaneglog.md
|
2015-08-11 00:53:43 +08:00 |
|
yanyiwu
|
41e4300c9a
|
LevelSegment
|
2015-08-11 00:53:06 +08:00 |
|
yanyiwu
|
efd029c20b
|
namespace husky; namespace limonp;
|
2015-08-08 12:30:14 +08:00 |
|
yanyiwu
|
8a3ced2b27
|
去掉一些没必要的返回值判断,精简代码
|
2015-07-24 14:39:03 +08:00 |
|
yanyiwu
|
0f79fa6c24
|
统一在SegmentBase搞定所有Unicode和string的转码事情
|
2015-07-24 13:42:24 +08:00 |
|
yanyiwu
|
4d86abb001
|
新增findByLimit函数
|
2015-07-23 21:10:56 +08:00 |
|
yanyiwu
|
78e41e5fd0
|
规范Unicode的相关命名,使用Rune代表一个中文字符
|
2015-07-21 14:54:50 +08:00 |
|
yanyiwu
|
0e16e000ea
|
解决一些历史遗留问题
|
2015-07-21 14:32:05 +08:00 |
|
yanyiwu
|
620d276887
|
底层常用结构修整
|
2015-07-21 12:11:43 +08:00 |
|
yanyiwu
|
83222918cc
|
更新ChangeLog
|
2015-07-21 11:26:33 +08:00 |
|
Yanyi Wu
|
5296a83823
|
Merge pull request #44 from aholic/master
提升Trie的效率
|
2015-07-21 11:15:26 +08:00 |
|
aholic
|
f5e74a3f46
|
replace old trie
|
2015-07-21 00:29:49 +08:00 |
|
aholic
|
f5d824043c
|
Merge branch 'master' of https://github.com/aholic/cppjieba
|
2015-07-21 00:17:02 +08:00 |
|
aholic
|
791ee25295
|
pull upstream
|
2015-07-21 00:16:49 +08:00 |
|
xuangong
|
cf9cc45c19
|
astyle
|
2015-07-21 00:11:13 +08:00 |
|
xuangong
|
931db7d1e5
|
astyle
|
2015-07-20 23:54:20 +08:00 |
|
yanyiwu
|
6e723c2c58
|
v3.1.0
v3.1.0
|
2015-06-27 13:19:26 +08:00 |
|
yanyiwu
|
2ae6eba3a7
|
更新insertUserWord的示例程序
|
2015-06-27 13:16:25 +08:00 |
|
yanyiwu
|
d33c09d74a
|
增加单元测试
|
2015-06-27 12:34:27 +08:00 |
|
yanyiwu
|
64d073d194
|
支持insertUserWord接口
|
2015-06-27 11:39:43 +08:00 |
|
yanyiwu
|
c5f7d4d670
|
重构trie前先ci一下
|
2015-06-26 14:29:44 +08:00 |
|
yanyiwu
|
e0db070529
|
开放insertUserWord接口;增加cut的默认参数,默认切词算法为Mix
|
2015-06-26 12:22:11 +08:00 |
|
yanyiwu
|
1d27559209
|
refactor DictTrie, and expose function: insertUserWord
|
2015-06-26 11:49:35 +08:00 |
|
yanyiwu
|
ee255baf56
|
v3.0.1 提升兼容性,修复在某些特定环境下的编译错误问题。
v3.0.1
|
2015-06-24 16:01:41 +08:00 |
|
yanyiwu
|
9284fe1872
|
性能评测
|
2015-06-14 12:21:09 +08:00 |
|
yanyiwu
|
389914ae1b
|
修复部分代码在 windows 上编译不通过的问题,提升兼容性。
|
2015-06-09 15:31:43 +08:00 |
|
yanyiwu
|
e3c57c0ba1
|
提升兼容性,修复在某些特定环境下的编译错误问题。
|
2015-06-08 15:01:59 +08:00 |
|
yanyiwu
|
67cc5941be
|
update demo
|
2015-06-07 11:13:33 +08:00 |
|
yanyiwu
|
acd01bda99
|
v3.0.0
v3.0.0
|
2015-06-06 11:47:04 +08:00 |
|
yanyiwu
|
3528b6296a
|
修改 cjserver 服务,可以通过http参数使用不同切词算法进行切词。
修改 make install 的安装目录,统一安装到同一个目录 /usr/local/cppjieba
|
2015-06-05 21:59:16 +08:00 |
|
yanyiwu
|
8ce2af9706
|
更新Demo示例文件,demo只使用一个Application实例即可。
|
2015-06-05 18:12:27 +08:00 |
|
yanyiwu
|
e5d1ac7bc8
|
把dict/{extra_dict,gbk_dict} 挪进 test/testdata
|
2015-06-05 16:31:43 +08:00 |
|
yanyiwu
|
a3d9b40c2a
|
修改QuerySegment的构造函数参数顺序
|
2015-06-05 16:23:51 +08:00 |
|
yanyiwu
|
45588b75cc
|
增加 Application 这个类,整合了所有CppJieba的功能进去,以后用户只需要使用这个类即可。
|
2015-06-05 16:00:32 +08:00 |
|
yanyiwu
|
d56bf2cc68
|
重构:增加让各个分词类的构造函数,为后面的憋大招做准备。
|
2015-06-04 22:38:55 +08:00 |
|
yanyiwu
|
b99d0698f0
|
将 HMMSegment 里面关于模型文件的数据独立成 HMMModel
|
2015-06-04 17:52:18 +08:00 |
|
yanyiwu
|
d3b34b73c6
|
更新关于分词服务中,分词算法修改的办法。
|
2015-06-04 14:40:34 +08:00 |
|