7 Commits

Author SHA1 Message Date
Fukuball Lin
b658ee69cb 讓 jieba 可以自行增加 stop words 語料庫
1. 增加範例 stop words 語料庫
2. 為了讓 jieba 可以切換 stop words 語料庫,新增 set_stop_words 方法,並改寫 extract_tags
3. test 增加 extract_tags_stop_words.py 測試範例
2014-08-06 03:35:16 +08:00
Fukuball Lin
7198d562f1 讓 jieba 可以切換 idf 語料庫
1. 新增繁體中文 idf 語料庫
2. 為了讓 jieba 可以切換 iff 語料庫,新增 get_idf, set_idf_path 方法,並改寫 extract_tags
3. test 增加 extract_tags_idfpath
2014-08-05 22:55:13 +08:00
Sun Junyi
237dc6625e add mix words to extra_dict/dict.txt.big 2013-06-26 09:36:41 +08:00
Sun Junyi
b050bfe946 remove some useless words 2013-06-08 15:40:01 +08:00
Sun Junyi
a8f902545c fix some bad cases 2013-05-15 18:21:08 +08:00
Herman Schaaf
c6098a8657 Add initialize function and lazy initialization 2013-04-25 21:04:56 +09:00
Sun Junyi
8a699cf462 extra dictionary 2013-02-18 10:48:16 +08:00