add stop_words.utf8

This commit is contained in:
wyy 2014-03-15 23:11:22 +08:00
parent d96c37d372
commit 752ae03b34

View File

@ -19,11 +19,13 @@ __对于MixSegment(混合MPSegment和HMMSegment两者)则同时使用以上两
## 关键词抽取 ## 关键词抽取
## idf.utf8 ### idf.utf8
IDF(Inverse Document Frequency) IDF(Inverse Document Frequency)
在KeywordExtractor中使用的是经典的TF-IDF算法所以需要这么一个词典提供IDF信息。 在KeywordExtractor中使用的是经典的TF-IDF算法所以需要这么一个词典提供IDF信息。
### stop_words.utf8
停用词词典