mirror of
https://github.com/yanyiwu/cppjieba.git
synced 2025-07-18 00:00:12 +08:00
modify README.md
This commit is contained in:
parent
335a7eff47
commit
202e4670f1
17
README.md
17
README.md
@ -70,8 +70,6 @@ Output:
|
|||||||
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
||||||
小/明/硕士/毕业/于/中国科学院/计算所/,/后/在/日本京都大学/深造
|
小/明/硕士/毕业/于/中国科学院/计算所/,/后/在/日本京都大学/深造
|
||||||
|
|
||||||
我来自北京邮电大学。。。学号091111xx。。。
|
|
||||||
我/来自/北京邮电大学/。。。/学/号/091111xx/。。。
|
|
||||||
```
|
```
|
||||||
|
|
||||||
### HMMSegment's demo
|
### HMMSegment's demo
|
||||||
@ -87,8 +85,6 @@ Output:
|
|||||||
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
||||||
小明/硕士/毕业于/中国/科学院/计算所/,/后/在/日/本/京/都/大/学/深/造
|
小明/硕士/毕业于/中国/科学院/计算所/,/后/在/日/本/京/都/大/学/深/造
|
||||||
|
|
||||||
我来自北京邮电大学。。。学号091111xx。。。
|
|
||||||
我来/自北京/邮电大学/。。。/学号/091111xx/。。。
|
|
||||||
```
|
```
|
||||||
|
|
||||||
### MixSegment's demo
|
### MixSegment's demo
|
||||||
@ -104,8 +100,6 @@ Output:
|
|||||||
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
||||||
小明/硕士/毕业/于/中国科学院/计算所/,/后/在/日本京都大学/深造
|
小明/硕士/毕业/于/中国科学院/计算所/,/后/在/日本京都大学/深造
|
||||||
|
|
||||||
我来自北京邮电大学。。。学号091111xx。。。
|
|
||||||
我/来自/北京邮电大学/。。。/学号/091111xx/。。。
|
|
||||||
```
|
```
|
||||||
|
|
||||||
### FullSegment's demo
|
### FullSegment's demo
|
||||||
@ -121,8 +115,6 @@ Output:
|
|||||||
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
||||||
小/明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造
|
小/明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造
|
||||||
|
|
||||||
我来自北京邮电大学。。。 学号 091111xx。。。
|
|
||||||
我/来自/北京/北京邮电/北京邮电大学/邮电/邮电大学/电大/大学/。/。/。/ /学号/ 091111xx/。/。/。
|
|
||||||
```
|
```
|
||||||
|
|
||||||
### QuerySegment's demo
|
### QuerySegment's demo
|
||||||
@ -138,8 +130,6 @@ Output:
|
|||||||
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
小明硕士毕业于中国科学院计算所,后在日本京都大学深造
|
||||||
小明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算所/,/后/在/中国/中国科学院/科学/科学院/学院/日本/日本京都大学/京都/京都大学/大学/深造
|
小明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算所/,/后/在/中国/中国科学院/科学/科学院/学院/日本/日本京都大学/京都/京都大学/大学/深造
|
||||||
|
|
||||||
我来自北京邮电大学。。。 学号 091111xx。。。
|
|
||||||
我/来自/北京/北京邮电/北京邮电大学/邮电/邮电大学/电大/大学/。/。/。/ /学号/ 091111xx/。/。/。
|
|
||||||
```
|
```
|
||||||
|
|
||||||
### 效果分析
|
### 效果分析
|
||||||
@ -152,6 +142,7 @@ Full方法切出所有字典里的词语。
|
|||||||
|
|
||||||
Query方法先使用Mix方法切词,对于切出来的较长的词再使用Full方法。
|
Query方法先使用Mix方法切词,对于切出来的较长的词再使用Full方法。
|
||||||
|
|
||||||
|
|
||||||
## 模块详解
|
## 模块详解
|
||||||
|
|
||||||
本项目主要是如下目录组成:
|
本项目主要是如下目录组成:
|
||||||
@ -197,12 +188,6 @@ TransCode.cpp/TransCode.h 负责转换编码类型,将utf8和gbk转换成`uint
|
|||||||
|
|
||||||
详见: https://github.com/aszxqw/limonp
|
详见: https://github.com/aszxqw/limonp
|
||||||
|
|
||||||
## 分词速度
|
|
||||||
|
|
||||||
### MixSegment
|
|
||||||
|
|
||||||
分词速度大概是 2M/sec 测试环境: `Intel(R) Xeon(R) CPU E5506 @ 2.13GHz` 电脑下开的ubuntu虚拟机
|
|
||||||
|
|
||||||
## 关于CppJieba的跨语言包装使用
|
## 关于CppJieba的跨语言包装使用
|
||||||
|
|
||||||
收到邮件询问跨语言包装(ios应用开发)使用的问题,这方面我没有相关的经验,建议参考如下python使用cppjieba的项目:
|
收到邮件询问跨语言包装(ios应用开发)使用的问题,这方面我没有相关的经验,建议参考如下python使用cppjieba的项目:
|
||||||
|
Loading…
x
Reference in New Issue
Block a user