mirror of
https://github.com/fxsjy/jieba.git
synced 2025-07-10 00:01:33 +08:00
quick fix of doc
This commit is contained in:
parent
db69da1de6
commit
925e955bfd
13
README.md
13
README.md
@ -58,19 +58,20 @@ Output:
|
||||
* 词典格式和dict.txt一样,一个词占一行;每一行分为两部分,一部分为词语,另一部分为词频,用空格隔开
|
||||
* 范例:
|
||||
|
||||
云计算 5
|
||||
李小福 2
|
||||
创新办 3
|
||||
云计算 5
|
||||
李小福 2
|
||||
创新办 3
|
||||
|
||||
之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 /
|
||||
加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 /
|
||||
之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 /
|
||||
|
||||
加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 /
|
||||
|
||||
|
||||
功能 3) :关键词提取
|
||||
================
|
||||
* jieba.analyse.extract_tags(sentence,topK) #需要先import jieba.analyse
|
||||
* setence为待提取的文本
|
||||
* topK为返回几个权重最大的关键词,默认值为20
|
||||
* topK为返回几个TF/IDF权重最大的关键词,默认值为20
|
||||
|
||||
代码示例 (关键词提取)
|
||||
|
||||
|
Loading…
x
Reference in New Issue
Block a user