From 9f10122257382286f8c676e6066c2e06c9e2f256 Mon Sep 17 00:00:00 2001 From: Sun Junyi Date: Tue, 27 Nov 2012 14:08:09 +0800 Subject: [PATCH 1/3] Update README.md --- README.md | 3 +-- 1 file changed, 1 insertion(+), 2 deletions(-) diff --git a/README.md b/README.md index b2c1140..0f89f16 100644 --- a/README.md +++ b/README.md @@ -56,8 +56,7 @@ Output: 【新词识别】:他, 来到, 了, 网易, 杭研, 大厦 (此处,“杭研”并没有在词典中,但是也被Viterbi算法识别出来了) - 【搜索引擎模式】: 小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, 后, 在 -, 日本, 京都, 大学, 日本京都大学, 深造 + 【搜索引擎模式】: 小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, 后, 在, 日本, 京都, 大学, 日本京都大学, 深造 功能 2) :添加自定义词典 ================ From 3f193540ca50ff6c3c8ae39ba3cb2eb6cff0c868 Mon Sep 17 00:00:00 2001 From: Sun Junyi Date: Tue, 27 Nov 2012 15:31:58 +0800 Subject: [PATCH 2/3] Update README.md --- README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README.md b/README.md index 0f89f16..3672337 100644 --- a/README.md +++ b/README.md @@ -6,7 +6,7 @@ jieba Feature ======== -* 支持两种分词模式: +* 支持三种分词模式: * 1)精确模式,试图将句子最精确地切开,适合文本分析; * 2)全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; * 3) 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 From 2cbcd2d2a5d366b2295b00f547c622fcd17305cd Mon Sep 17 00:00:00 2001 From: Sun Junyi Date: Wed, 28 Nov 2012 11:31:47 +0800 Subject: [PATCH 3/3] Update README.md --- README.md | 5 +++++ 1 file changed, 5 insertions(+) diff --git a/README.md b/README.md index 3672337..418783d 100644 --- a/README.md +++ b/README.md @@ -11,6 +11,11 @@ Feature * 2)全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; * 3) 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 +Python Version +============== +* 目前master分支是只支持Python2.x 的 +* Python3.x 版本的分支也已经基本可用: https://github.com/fxsjy/jieba/tree/jieba3k + Usage ======== * 全自动安装:`easy_install jieba` 或者 `pip install jieba`