diff --git a/README.md b/README.md index f858c12..3eef6d0 100644 --- a/README.md +++ b/README.md @@ -58,19 +58,20 @@ Output: * 词典格式和dict.txt一样,一个词占一行;每一行分为两部分,一部分为词语,另一部分为词频,用空格隔开 * 范例: - 云计算 5 - 李小福 2 - 创新办 3 + 云计算 5 + 李小福 2 + 创新办 3 - 之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 / - 加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 / + 之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 / + + 加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 / 功能 3) :关键词提取 ================ * jieba.analyse.extract_tags(sentence,topK) #需要先import jieba.analyse * setence为待提取的文本 -* topK为返回几个权重最大的关键词,默认值为20 +* topK为返回几个TF/IDF权重最大的关键词,默认值为20 代码示例 (关键词提取)