modify changelog and readme

This commit is contained in:
wyy 2014-04-25 22:34:22 +08:00
parent 57ef504d9b
commit ac6207635f
2 changed files with 31 additions and 12 deletions

View File

@ -4,6 +4,8 @@
1. 完善一些特殊字符和字母串的切词效果。 1. 完善一些特殊字符和字母串的切词效果。
2. 提高关键词抽取的速度。 2. 提高关键词抽取的速度。
3. 提供用户自定义词典的接口。
4. 将server相关的代码独立出来单独放在`server/`目录下。
## v2.4.0 ## v2.4.0

View File

@ -8,10 +8,9 @@ CppJieba是"结巴"中文分词的C++版本
## Feature ## Feature
+ 源代码都写进头文件hpp里`include`即可使用。 + 源代码都写进头文件`src/*.hpp`里,`include`即可使用。
+ 支持`utf-8, gbk`编码,但是推荐使用`utf-8`编码。 + 支持`utf-8, gbk`编码,但是推荐使用`utf-8`编码。
+ 内置分词服务在linux环境下可安装使用。mac因为没有自带`epoll`,使用示例请看[libcppjieba]。 + 内置分词服务`server/server.cpp`在linux环境下可安装使用。
+ [libcppjieba] 最简单易懂的CppJieba头文件库使用示例。
+ 项目自带较为完善的单元测试,核心功能中文分词的稳定性接受过线上环境检验。 + 项目自带较为完善的单元测试,核心功能中文分词的稳定性接受过线上环境检验。
+ 支持载自定义用户词典。 + 支持载自定义用户词典。
@ -96,7 +95,11 @@ cat install_manifest.txt | sudo xargs rm -rf
## Demo ## Demo
最简单易懂的使用示例请看[libcppjieba]。它是根据[issue25]的建议专门弄的头文件库。 ```
make && ./segment.demo
```
see details in `test/segment_demo.cpp`.
### MPSegment's demo ### MPSegment's demo
@ -184,16 +187,30 @@ Query方法先使用Mix方法切词对于切出来的较长的词再使用Ful
### 自定义用户词典 ### 自定义用户词典
自定义词典示例请看`test/testdata/userdict.utf8`
载入自定义词典示例请看`test/segment.cpp`
没有使用自定义用户词典时的结果:
``` ```
令狐冲/是/云/计算/行业/的/专家
``` ```
使用自定义用户词典时的结果:
```
令狐冲/是/云计算/行业/的/专家
```
### 关键词抽取 ### 关键词抽取
``` ```
make && ./test/keyword.demo make && ./keyword.demo
``` ```
see details in `test/keyword_demo.cpp`.
you will see: you will see:
``` ```
@ -201,22 +218,18 @@ you will see:
["CEO:11.7392", "升职:10.8562", "加薪:10.6426", "手扶拖拉机:10.0089", "巅峰:9.49396"] ["CEO:11.7392", "升职:10.8562", "加薪:10.6426", "手扶拖拉机:10.0089", "巅峰:9.49396"]
``` ```
关键词抽取的demo代码请见`test/keyword_demo.cpp`
### 词性标注 ### 词性标注
``` ```
make && ./test/tagging_demo make && ./tagging.demo
``` ```
see details in `test/tagging_demo.cpp`.
``` ```
["我:r", "是:v", "蓝翔:x", "技工:n", "拖拉机:n", "学院:n", "手扶拖拉机:n", "专业:n", "的:uj", "。:x", "不用:v", "多久:m", ":x", "我:r", "就:d", "会:v", "升职:v", "加薪:nr", ":x", "当:t", "上:f", "总经理:n", ":x", "出任:v", "CEO:x", ":x", "迎娶:v", "白富美:x", ":x", "走上:v", "人生:n", "巅峰:n", "。:x"] ["我:r", "是:v", "蓝翔:x", "技工:n", "拖拉机:n", "学院:n", "手扶拖拉机:n", "专业:n", "的:uj", "。:x", "不用:v", "多久:m", ":x", "我:r", "就:d", "会:v", "升职:v", "加薪:nr", ":x", "当:t", "上:f", "总经理:n", ":x", "出任:v", "CEO:x", ":x", "迎娶:v", "白富美:x", ":x", "走上:v", "人生:n", "巅峰:n", "。:x"]
``` ```
__词性标注是一个未完成的部分现在只是一个简单版本。__
## Application ## Application
### 关于CppJieba的跨语言包装使用 ### 关于CppJieba的跨语言包装使用
@ -237,6 +250,10 @@ __词性标注是一个未完成的部分现在只是一个简单版本。__
如果有需要在`erlang`中使用分词的话,不妨试一下[exjieba]。 如果有需要在`erlang`中使用分词的话,不妨试一下[exjieba]。
### libcppjieba
[libcppjieba] 是最简单易懂的CppJieba头文件库使用示例。
## Online Demo ## Online Demo
http://cppjieba-webdemo.herokuapp.com/ http://cppjieba-webdemo.herokuapp.com/