From 202e4670f11f292133e5ff942d5102dab8c8e0eb Mon Sep 17 00:00:00 2001 From: wyy Date: Thu, 19 Dec 2013 06:12:12 -0800 Subject: [PATCH] modify README.md --- README.md | 17 +---------------- 1 file changed, 1 insertion(+), 16 deletions(-) diff --git a/README.md b/README.md index 468c558..282335c 100644 --- a/README.md +++ b/README.md @@ -70,8 +70,6 @@ Output: 小明硕士毕业于中国科学院计算所,后在日本京都大学深造 小/明/硕士/毕业/于/中国科学院/计算所/,/后/在/日本京都大学/深造 -我来自北京邮电大学。。。学号091111xx。。。 -我/来自/北京邮电大学/。。。/学/号/091111xx/。。。 ``` ### HMMSegment's demo @@ -87,8 +85,6 @@ Output: 小明硕士毕业于中国科学院计算所,后在日本京都大学深造 小明/硕士/毕业于/中国/科学院/计算所/,/后/在/日/本/京/都/大/学/深/造 -我来自北京邮电大学。。。学号091111xx。。。 -我来/自北京/邮电大学/。。。/学号/091111xx/。。。 ``` ### MixSegment's demo @@ -104,8 +100,6 @@ Output: 小明硕士毕业于中国科学院计算所,后在日本京都大学深造 小明/硕士/毕业/于/中国科学院/计算所/,/后/在/日本京都大学/深造 -我来自北京邮电大学。。。学号091111xx。。。 -我/来自/北京邮电大学/。。。/学号/091111xx/。。。 ``` ### FullSegment's demo @@ -121,8 +115,6 @@ Output: 小明硕士毕业于中国科学院计算所,后在日本京都大学深造 小/明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造 -我来自北京邮电大学。。。 学号 091111xx。。。 -我/来自/北京/北京邮电/北京邮电大学/邮电/邮电大学/电大/大学/。/。/。/ /学号/ 091111xx/。/。/。 ``` ### QuerySegment's demo @@ -138,8 +130,6 @@ Output: 小明硕士毕业于中国科学院计算所,后在日本京都大学深造 小明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算所/,/后/在/中国/中国科学院/科学/科学院/学院/日本/日本京都大学/京都/京都大学/大学/深造 -我来自北京邮电大学。。。 学号 091111xx。。。 -我/来自/北京/北京邮电/北京邮电大学/邮电/邮电大学/电大/大学/。/。/。/ /学号/ 091111xx/。/。/。 ``` ### 效果分析 @@ -152,6 +142,7 @@ Full方法切出所有字典里的词语。 Query方法先使用Mix方法切词,对于切出来的较长的词再使用Full方法。 + ## 模块详解 本项目主要是如下目录组成: @@ -197,12 +188,6 @@ TransCode.cpp/TransCode.h 负责转换编码类型,将utf8和gbk转换成`uint 详见: https://github.com/aszxqw/limonp -## 分词速度 - -### MixSegment - -分词速度大概是 2M/sec 测试环境: `Intel(R) Xeon(R) CPU E5506 @ 2.13GHz` 电脑下开的ubuntu虚拟机 - ## 关于CppJieba的跨语言包装使用 收到邮件询问跨语言包装(ios应用开发)使用的问题,这方面我没有相关的经验,建议参考如下python使用cppjieba的项目: