From c9e8da9e634d5a72e1db4b538c2d9ec4ddf8e403 Mon Sep 17 00:00:00 2001 From: Sun Junyi Date: Tue, 18 Jun 2013 14:10:36 +0800 Subject: [PATCH] add more mix words to dict.txt --- jieba/dict.txt | 58 ++++++++++++++++++++++++++++++++++++++++++++++++++ test/test.py | 1 + 2 files changed, 59 insertions(+) diff --git a/jieba/dict.txt b/jieba/dict.txt index 0015948..f3c1779 100644 --- a/jieba/dict.txt +++ b/jieba/dict.txt @@ -5,6 +5,64 @@ C# 3 nz c++ 3 nz C++ 3 nz T恤 4 n +A座 3 n +A股 3 n +A型 3 n +AA制 3 n +AB型 3 n +B座 3 n +B股 3 n +B型 3 n +B超 3 n +BB机 3 n +BP机 3 n +C盘 3 n +C座 3 n +C语言 3 n +CD盒 3 n +CD机 3 n +CALL机 3 n +D盘 3 n +D座 3 n +D版 3 n +E盘 3 n +E座 3 n +E化 3 n +E通 3 n +F盘 3 n +F座 3 n +G盘 3 n +H盘 3 n +H股 3 n +I盘 3 n +IC卡 3 n +IP卡 3 n +IP电话 3 n +IP地址 3 n +K党 3 n +K歌之王 3 n +N年 3 n +O型 3 n +PC机 3 n +PH值 3 n +SIM卡 3 n +U盘 3 n +VISA卡 3 n +Z盘 3 n +Q版 3 n +QQ号 3 n +RSS订阅 3 n +T盘 3 n +X光 3 n +X光线 3 n +X射线 3 n +γ射线 3 n +T恤衫 3 n +T型台 3 n +T台 3 n +江南style 3 n +江南Style 3 n +阿Q 3 n 一 217830 m 一一 1670 m 一一二 11 m diff --git a/test/test.py b/test/test.py index f1d3241..4d35dc1 100644 --- a/test/test.py +++ b/test/test.py @@ -96,3 +96,4 @@ if __name__ == "__main__": cuttest('你认识那个和主席握手的的哥吗?他开一辆黑色的士。') cuttest('枪杆子中出政权') cuttest('张三风同学走上了不归路') + cuttest('阿Q腰间挂着BB机手里拿着大哥大,说:我一般吃饭不AA制的。')