diff --git a/README.md b/README.md index 8afbc2d..80280d7 100644 --- a/README.md +++ b/README.md @@ -190,9 +190,8 @@ make && ./test/keyword.demo you will see: ``` -我是蓝翔技工拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上总经理,出任CEO,迎娶白富美,走上人生巅峰。 - -> -["CEO:11.7392", "蓝翔:11.7392", "白富美:11.7392", "升职:10.8562", "加薪:10.6426"] +我是拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上CEO,走上人生巅峰。 +["CEO:11.7392", "升职:10.8562", "加薪:10.6426", "手扶拖拉机:10.0089", "巅峰:9.49396"] ``` 关键词抽取的demo代码请见`test/keyword_demo.cpp` diff --git a/src/HMMSegment.hpp b/src/HMMSegment.hpp index 6fe25c5..0572a36 100644 --- a/src/HMMSegment.hpp +++ b/src/HMMSegment.hpp @@ -69,13 +69,42 @@ namespace CppJieba } public: using SegmentBase::cut; + public: bool cut(Unicode::const_iterator begin, Unicode::const_iterator end, vector& res)const { - if(!_getInitFlag()) + Unicode::const_iterator left = begin; + Unicode::const_iterator right = begin; + while(right != end) + { + if(*right < 0x80) + { + if(left != right && !_cut(left, right, res)) + { + return false; + } + left = right; + while(*right < 0x80 && right != end) + { + right++; + } + res.push_back(Unicode(left, right)); + left = right; + } + else + { + right++; + } + } + if(left != right && !_cut(left, right, res)) { - LogError("not inited."); return false; } + return true; + } + private: + bool _cut(Unicode::const_iterator begin, Unicode::const_iterator end, vector& res) const + { + assert(_getInitFlag()); vector status; if(!_viterbi(begin, end, status)) { @@ -85,7 +114,7 @@ namespace CppJieba Unicode::const_iterator left = begin; Unicode::const_iterator right; - for(size_t i =0; i< status.size(); i++) + for(size_t i = 0; i < status.size(); i++) { if(status[i] % 2) //if(E == status[i] || S == status[i]) { @@ -171,7 +200,7 @@ namespace CppJieba endE = weight[X-1+E*X]; endS = weight[X-1+S*X]; stat = 0; - if(endE > endS) + if(endE >= endS) { stat = E; } diff --git a/src/SegmentBase.hpp b/src/SegmentBase.hpp index 98a1276..fcac6d0 100644 --- a/src/SegmentBase.hpp +++ b/src/SegmentBase.hpp @@ -14,9 +14,9 @@ namespace CppJieba //const char* const SPECIAL_CHARS = " \t\n"; #ifndef CPPJIEBA_GBK - const uint32_t SPECIAL_SYMBOL[] = {32u, 9u, 10u, 12290u, 65292u}; + const UnicodeValueType SPECIAL_SYMBOL[] = {32u, 9u, 10u, 12290u, 65292u}; #else - const uint32_t SPECIAL_SYMBOL[] = {32u, 9u, 10u}; + const UnicodeValueType SPECIAL_SYMBOL[] = {32u, 9u, 10u}; #endif class SegmentBase: public ISegment, public InitOnOff @@ -25,7 +25,7 @@ namespace CppJieba SegmentBase(){_loadSpecialSymbols();}; virtual ~SegmentBase(){}; private: - unordered_set _specialSymbols; + unordered_set _specialSymbols; private: void _loadSpecialSymbols() { @@ -76,108 +76,6 @@ namespace CppJieba return true; } - //virtual bool cut(const string& str, vector& res)const - //{ - // assert(_getInitFlag()); - // Unicode unico; - // res.clear(); - // const char * const cstr = str.c_str(); - // size_t size = str.size(); - // size_t offset = 0; - // string subs; - // int ret; - // size_t len; - // while(offset < size) - // { - // const char * const nstr = cstr + offset; - // size_t nsize = size - offset; - // if(-1 == (ret = filterSpecialChars(nstr, nsize, len)) || 0 == len || len > nsize) - // { - // LogFatal("str[%s] illegal.", cstr); - // return false; - // } - // subs.assign(nstr, len); - // if(!ret) - // { - // res.push_back(subs); - // } - // else - // { - // unico.clear(); - // if(!TransCode::decode(subs, unico)) - // { - // LogFatal("str[%s] decode failed.", subs.c_str()); - // return false; - // } - // cut(unico.begin(), unico.end(), res); - // } - // offset += len; - // } - // return true; - //} - public: - - /* - * if char is SPECIAL_CHARS, count the SPECITAL_CHARS string's length and return 0; - * else count the NO SPECIAL_CHARS string's length and return 1; - * if errors, return -1; - * */ - //static int filterSpecialChars(const char* str, size_t len, size_t& resLen) - //{ - // if(!str || !len) - // { - // return -1; - // } - - // resLen = 1; - // int flag = (strchr(SPECIAL_CHARS, *str) ? 0: 1); - // for(size_t i = 1; i < len && bool(flag) != bool(strchr(SPECIAL_CHARS, str[i])); i++) - // { - // resLen ++; - // } - // return flag; - - //} - - /* - * if char is ascii, count the ascii string's length and return 0; - * else count the nonascii string's length and return 1; - * if errors, return -1; - * */ - static int filterAscii(const char* str, size_t len, size_t& resLen) - { - if(!str || !len) - { - return -1; - } - char x = 0x80; - int resFlag = (str[0] & x ? 1 : 0); - resLen = 0; - if(!resFlag) - { - while(resLen < len && !(str[resLen] & x)) - { - resLen ++; - } - } - else - { - while(resLen < len && (str[resLen] & x)) - { -#ifdef CPPJIEBA_GBK - resLen += 2; -#else - resLen ++; -#endif - } - } - if(resLen > len) - { - return -1; - } - return resFlag; - } - }; } diff --git a/src/TransCode.hpp b/src/TransCode.hpp index aa05341..a2ee25e 100644 --- a/src/TransCode.hpp +++ b/src/TransCode.hpp @@ -12,7 +12,8 @@ namespace CppJieba { using namespace Limonp; - typedef std::vector Unicode; + typedef uint16_t UnicodeValueType; + typedef std::vector Unicode; namespace TransCode { inline bool decode(const string& str, Unicode& vec) diff --git a/test/keyword_demo.cpp b/test/keyword_demo.cpp index 7f38f20..0bcb92d 100644 --- a/test/keyword_demo.cpp +++ b/test/keyword_demo.cpp @@ -4,10 +4,10 @@ using namespace CppJieba; int main(int argc, char ** argv) { KeywordExtractor extractor("../dict/jieba.dict.utf8", "../dict/hmm_model.utf8", "../dict/idf.utf8", "../dict/stop_words.utf8"); - string s("我是蓝翔技工拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上总经理,出任CEO,迎娶白富美,走上人生巅峰。"); + string s("我是拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上CEO,走上人生巅峰。"); vector > wordweights; size_t topN = 5; extractor.extract(s, wordweights, topN); - cout<< s << "\n -> \n" << wordweights << endl; + cout<< s << '\n' << wordweights << endl; return EXIT_SUCCESS; } diff --git a/test/testdata/review.100.res b/test/testdata/review.100.res index a7b3e54..56920d5 100644 --- a/test/testdata/review.100.res +++ b/test/testdata/review.100.res @@ -1,169 +1,169 @@ 标  签:保湿还不错比商场便宜补水效果好乳液很好用是正品心  得:感觉还蛮好吸收的,不错啦 -["标", "  ", "签", ":", "保湿", "还", "不错", "比", "商场", "便宜", "补水", "效果", "好", "乳液", "很", "好", "用", "是", "正品", "心", "  ", "得", ":", "感觉", "还", "蛮", "好", "吸收", "的", ",", "不错", "啦"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "保湿", "还", "不错", "比", "商场", "便宜", "补水", "效果", "好", "乳液", "很", "好", "用", "是", "正品", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "感觉", "还", "蛮", "好", "吸收", "的", ",", "不错", "啦"] 标  签:还可以心  得:不错~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ -["标", "  ", "签", ":", "还", "可以", "心", "  ", "得", ":", "不错", "~~~~~~~~~~~~~~~~~~~~~~~~~~~~~"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "还", "可以", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不错", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~"] 标  签:是正品心  得:下次我还要咋京东这里买不错 -["标", "  ", "签", ":", "是", "正品", "心", "  ", "得", ":", "下次", "我", "还要", "咋", "京东", "这里", "买", "不错"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "是", "正品", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "下次", "我", "还要", "咋", "京东", "这里", "买", "不错"] 标  签:挺保湿的心  得:价格实惠,适合夏天用,很轻薄 -["标", "  ", "签", ":", "挺", "保湿", "的", "心", "  ", "得", ":", "价格", "实惠", ",", "适合", "夏天", "用", ",", "很", "轻薄"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "挺", "保湿", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "价格", "实惠", ",", "适合", "夏天", "用", ",", "很", "轻薄"] 标  签:皮肤滑滑的味道不错挺保湿的很好用物流速度快心  得:使用的挺好的一直用着这个的 -["标", "  ", "签", ":", "皮肤", "滑", "滑", "的", "味道", "不错", "挺", "保湿", "的", "很", "好", "用", "物流", "速度", "快", "心", "  ", "得", ":", "使用", "的", "挺", "好", "的", "一直", "用", "着", "这个", "的"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "皮肤", "滑", "滑", "的", "味道", "不错", "挺", "保湿", "的", "很", "好", "用", "物流", "速度", "快", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "使用", "的", "挺", "好", "的", "一直", "用", "着", "这个", "的"] 标  签:价格实惠比商场便宜心  得:不错不错,活动买的很划算 -["标", "  ", "签", ":", "价格", "实惠", "比", "商场", "便宜", "心", "  ", "得", ":", "不错", "不错", ",", "活动", "买", "的", "很", "划算"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "价格", "实惠", "比", "商场", "便宜", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不错", "不错", ",", "活动", "买", "的", "很", "划算"] 标  签:吸收快品牌好是正品挺保湿的心  得:一直使用3年,值得信赖,好用 -["标", "  ", "签", ":", "吸收", "快", "品牌", "好", "是", "正品", "挺", "保湿", "的", "心", "  ", "得", ":", "一直", "使用", "3", "年", ",", "值得", "信赖", ",", "好", "用"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "吸收", "快", "品牌", "好", "是", "正品", "挺", "保湿", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "使用", "3", "年", ",", "值得", "信赖", ",", "好", "用"] 标  签:是正品皮肤滑滑的补水效果好乳液很好用心  得:不错不错老婆很喜欢我值 -["标", "  ", "签", ":", "是", "正品", "皮肤", "滑", "滑", "的", "补水", "效果", "好", "乳液", "很", "好", "用心", "  ", "得", ":", "不错", "不错", "老婆", "很", "喜欢", "我", "值"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "是", "正品", "皮肤", "滑", "滑", "的", "补水", "效果", "好", "乳液", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不错", "不错", "老婆", "很", "喜欢", "我", "值"] 标  签:保湿还不错心  得:挺好的。。。。。。。。。。 -["标", "  ", "签", ":", "保湿", "还", "不错", "心", "  ", "得", ":", "挺", "好", "的", "。", "。", "。", "。", "。", "。", "。", "。", "。", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "保湿", "还", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "挺", "好", "的", "。", "。", "。", "。", "。", "。", "。", "。", "。", "。"] 标  签:是正品很好用心  得:一直在京东买,可以信赖 -["标", "  ", "签", ":", "是", "正品", "很", "好", "用心", "  ", "得", ":", "一直", "在", "京东", "买", ",", "可以", "信赖"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "是", "正品", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "在", "京东", "买", ",", "可以", "信赖"] 标  签:是正品挺保湿的效果不错心  得:送货快!是正品,大品牌的用的放心! -["标", "  ", "签", ":", "是", "正品", "挺", "保湿", "的", "效果", "不错", "心", "  ", "得", ":", "送货", "快", "!", "是", "正品", ",", "大", "品牌", "的", "用", "的", "放心", "!"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "是", "正品", "挺", "保湿", "的", "效果", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "送货", "快", "!", "是", "正品", ",", "大", "品牌", "的", "用", "的", "放心", "!"] 标  签:乳液很好用心  得:很好的东东,下次还会买 -["标", "  ", "签", ":", "乳液", "很", "好", "用心", "  ", "得", ":", "很", "好", "的", "东东", ",", "下次", "还", "会", "买"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "乳液", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "很", "好", "的", "东东", ",", "下次", "还", "会", "买"] 心  得:送同学的,希望她喜欢 -["心", "  ", "得", ":", "送", "同学", "的", ",", "希望", "她", "喜欢"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "送", "同学", "的", ",", "希望", "她", "喜欢"] 标  签:价格实惠心  得:一直用,还可以吧,性价比高 -["标", "  ", "签", ":", "价格", "实惠", "心", "  ", "得", ":", "一直", "用", ",", "还", "可以", "吧", ",", "性价比", "高"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "价格", "实惠", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "用", ",", "还", "可以", "吧", ",", "性价比", "高"] 心  得:不错够速度,效果也不错,希望大家用着也一样,顶顶顶 -["心", "  ", "得", ":", "不错", "够", "速度", ",", "效果", "也", "不错", ",", "希望", "大家", "用", "着", "也", "一样", ",", "顶", "顶", "顶"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不错", "够", "速度", ",", "效果", "也", "不错", ",", "希望", "大家", "用", "着", "也", "一样", ",", "顶", "顶", "顶"] 标  签:挺保湿的心  得:用着还不错。挺好的。 -["标", "  ", "签", ":", "挺", "保湿", "的", "心", "  ", "得", ":", "用", "着", "还", "不错", "。", "挺", "好", "的", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "挺", "保湿", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "用", "着", "还", "不错", "。", "挺", "好", "的", "。"] 优  点:东西很好哦!不  足:暂时还没有发现缺点哦!心  得:很好,也很划算 -["优", "  ", "点", ":", "东西", "很", "好", "哦", "!", "不", "  ", "足", ":", "暂时", "还", "没有", "发现", "缺点", "哦", "!", "心", "  ", "得", ":", "很", "好", ",", "也", "很", "划算"] +["优", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "点", ":", "东西", "很", "好", "哦", "!", "不", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "足", ":", "暂时", "还", "没有", "发现", "缺点", "哦", "!", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "很", "好", ",", "也", "很", "划算"] 标  签:脸上很舒服是正品心  得:哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈和 -["标", "  ", "签", ":", "脸上", "很", "舒服", "是", "正品", "心", "  ", "得", ":", "哈哈哈", "哈哈哈", "哈哈哈", "哈哈哈", "哈哈哈", "和"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "脸上", "很", "舒服", "是", "正品", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "哈哈哈", "哈哈哈", "哈哈哈", "哈哈哈", "哈哈哈", "和"] 优  点:用了一下,感觉还不错不  足:暂时还没有发现缺点哦!心  得:用了一下,还可以 -["优", "  ", "点", ":", "用", "了", "一下", ",", "感觉", "还", "不错", "不", "  ", "足", ":", "暂时", "还", "没有", "发现", "缺点", "哦", "!", "心", "  ", "得", ":", "用", "了", "一下", ",", "还", "可以"] +["优", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "点", ":", "用", "了", "一下", ",", "感觉", "还", "不错", "不", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "足", ":", "暂时", "还", "没有", "发现", "缺点", "哦", "!", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "用", "了", "一下", ",", "还", "可以"] 标  签:品牌好心  得:东西还行,就是线太少了 -["标", "  ", "签", ":", "品牌", "好心", "  ", "得", ":", "东西", "还", "行", ",", "就是", "线", "太", "少", "了"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "品牌", "好心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "东西", "还", "行", ",", "就是", "线", "太", "少", "了"] 标  签:还可以老婆买的心  得:代买的,据说还不错,搞优惠屯着。 -["标", "  ", "签", ":", "还", "可以", "老婆", "买", "的", "心", "  ", "得", ":", "代", "买", "的", ",", "据说", "还", "不错", ",", "搞", "优惠", "屯", "着", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "还", "可以", "老婆", "买", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "代", "买", "的", ",", "据说", "还", "不错", ",", "搞", "优惠", "屯", "着", "。"] 标  签:保湿还不错很好用心  得:一直在用这个,现在继续。 -["标", "  ", "签", ":", "保湿", "还", "不错", "很", "好", "用心", "  ", "得", ":", "一直", "在", "用", "这个", ",", "现在", "继续", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "保湿", "还", "不错", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "在", "用", "这个", ",", "现在", "继续", "。"] 标  签:很好用心  得:正品,方便好用,比店里便宜 -["标", "  ", "签", ":", "很", "好", "用心", "  ", "得", ":", "正品", ",", "方便", "好", "用", ",", "比", "店里", "便宜"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "正品", ",", "方便", "好", "用", ",", "比", "店里", "便宜"] 标  签:保湿还不错妈妈买的比商场便宜挺保湿的吸收快心  得:可以先去专柜试试~然后再京东上购买,由京东的发票,还是比较放心的~ -["标", "  ", "签", ":", "保湿", "还", "不错", "妈妈", "买", "的", "比", "商场", "便宜", "挺", "保湿", "的", "吸收", "快", "心", "  ", "得", ":", "可以", "先", "去", "专柜", "试试", "~", "然后", "再", "京东", "上", "购买", ",", "由", "京东", "的", "发票", ",", "还是", "比较", "放心", "的", "~"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "保湿", "还", "不错", "妈妈", "买", "的", "比", "商场", "便宜", "挺", "保湿", "的", "吸收", "快", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "可以", "先", "去", "专柜", "试试", "~", "然后", "再", "京东", "上", "购买", ",", "由", "京东", "的", "发票", ",", "还是", "比较", "放心", "的", "~"] 心  得:很好很滋润又不油 -["心", "  ", "得", ":", "很", "好", "很", "滋润", "又", "不", "油"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "很", "好", "很", "滋润", "又", "不", "油"] 标  签:吸收快脸上很舒服保湿还不错很好用比商场便宜心  得:用过几瓶了http://club.jd.com/JdVote/TradeComment.aspx?ruleid=586763684&ot=0#none,感觉很不错,不油腻,吸收快,还保湿。 -["标", "  ", "签", ":", "吸收", "快", "脸上", "很", "舒服", "保湿", "还", "不错", "很", "好", "用", "比", "商场", "便宜", "心", "  ", "得", ":", "用", "过", "几瓶", "了", "http://club.jd.com/JdVote/TradeComment.aspx?ruleid=586763684&ot=0#none", ",", "感觉", "很", "不错", ",", "不", "油腻", ",", "吸收", "快", ",", "还", "保湿", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "吸收", "快", "脸上", "很", "舒服", "保湿", "还", "不错", "很", "好", "用", "比", "商场", "便宜", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "用", "过", "几瓶", "了", "h", "t", "t", "p", ":", "/", "/", "c", "l", "u", "b", ".", "j", "d", ".", "c", "o", "m", "/", "J", "d", "V", "o", "t", "e", "/", "T", "r", "a", "d", "e", "C", "o", "m", "m", "e", "n", "t", ".", "a", "s", "p", "x", "?", "r", "u", "l", "e", "i", "d", "=", "5", "8", "6", "7", "6", "3", "6", "8", "4", "&", "o", "t", "=", "0", "#", "n", "o", "n", "e", ",", "感觉", "很", "不错", ",", "不", "油腻", ",", "吸收", "快", ",", "还", "保湿", "。"] 标  签:还可以心  得:一般吧,还没怎么用。现在不知道效果。 -["标", "  ", "签", ":", "还", "可以", "心", "  ", "得", ":", "一般", "吧", ",", "还", "没", "怎么", "用", "。", "现在", "不", "知道", "效果", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "还", "可以", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一般", "吧", ",", "还", "没", "怎么", "用", "。", "现在", "不", "知道", "效果", "。"] 标  签:还可以心  得:东西很不错。很好。很喜欢! -["标", "  ", "签", ":", "还", "可以", "心", "  ", "得", ":", "东西", "很", "不错", "。", "很", "好", "。", "很", "喜欢", "!"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "还", "可以", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "东西", "很", "不错", "。", "很", "好", "。", "很", "喜欢", "!"] 标  签:比商场便宜价格实惠心  得:一直都在用,没有刺激,很舒服,价格合适 -["标", "  ", "签", ":", "比", "商场", "便宜", "价格", "实惠", "心", "  ", "得", ":", "一直", "都", "在", "用", ",", "没有", "刺激", ",", "很", "舒服", ",", "价格", "合适"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "比", "商场", "便宜", "价格", "实惠", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "都", "在", "用", ",", "没有", "刺激", ",", "很", "舒服", ",", "价格", "合适"] 标  签:包装好服务好比商场便宜皮肤滑滑的很好用心  得:送货速度也很快!非常好,质量不错,推荐购买!包装很好! -["标", "  ", "签", ":", "包装", "好", "服务", "好比", "商场", "便宜", "皮肤", "滑", "滑", "的", "很", "好", "用心", "  ", "得", ":", "送货", "速度", "也", "很快", "!", "非常", "好", ",", "质量", "不错", ",", "推荐", "购买", "!", "包装", "很", "好", "!"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "包装", "好", "服务", "好比", "商场", "便宜", "皮肤", "滑", "滑", "的", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "送货", "速度", "也", "很快", "!", "非常", "好", ",", "质量", "不错", ",", "推荐", "购买", "!", "包装", "很", "好", "!"] 标  签:吸收快服务好心  得:质量不错,值得信赖,网购上京东,放心又轻松! -["标", "  ", "签", ":", "吸收", "快", "服务", "好心", "  ", "得", ":", "质量", "不错", ",", "值得", "信赖", ",", "网", "购", "上", "京东", ",", "放心", "又", "轻松", "!"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "吸收", "快", "服务", "好心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "质量", "不错", ",", "值得", "信赖", ",", "网", "购", "上", "京东", ",", "放心", "又", "轻松", "!"] 标  签:味道不错吸收快心  得:不油腻,味道也不错,美白效果嘛暂时没有,毕竟只用了几次而已。 -["标", "  ", "签", ":", "味道", "不错", "吸收", "快", "心", "  ", "得", ":", "不", "油腻", ",", "味道", "也", "不错", ",", "美", "白", "效果", "嘛", "暂时", "没有", ",", "毕竟", "只用", "了", "几次", "而已", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "味道", "不错", "吸收", "快", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不", "油腻", ",", "味道", "也", "不错", ",", "美", "白", "效果", "嘛", "暂时", "没有", ",", "毕竟", "只用", "了", "几次", "而已", "。"] 标  签:还可以价格实惠心  得:还不错,促销活动买的......... -["标", "  ", "签", ":", "还", "可以", "价格", "实惠", "心", "  ", "得", ":", "还", "不错", ",", "促销", "活动", "买", "的", "........."] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "还", "可以", "价格", "实惠", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "还", "不错", ",", "促销", "活动", "买", "的", ".", ".", ".", ".", ".", ".", ".", ".", "."] 标  签:挺保湿的效果不错脸上很舒服很好用心  得:帮朋友买的,她觉得非常不错,继续关注ZA -["标", "  ", "签", ":", "挺", "保湿", "的", "效果", "不错", "脸上", "很", "舒服", "很", "好", "用心", "  ", "得", ":", "帮", "朋友", "买", "的", ",", "她", "觉得", "非常", "不错", ",", "继续", "关注", "ZA"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "挺", "保湿", "的", "效果", "不错", "脸上", "很", "舒服", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "帮", "朋友", "买", "的", ",", "她", "觉得", "非常", "不错", ",", "继续", "关注", "Z", "A"] 标  签:乳液很好用心  得:比较清爽,补水效果并不是很好,夏天用用吧 -["标", "  ", "签", ":", "乳液", "很", "好", "用心", "  ", "得", ":", "比较", "清爽", ",", "补水", "效果", "并", "不是", "很", "好", ",", "夏天", "用", "用", "吧"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "乳液", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "比较", "清爽", ",", "补水", "效果", "并", "不是", "很", "好", ",", "夏天", "用", "用", "吧"] 标  签:是正品补水效果好还可以心  得:补水效果不错,很好用 -["标", "  ", "签", ":", "是", "正品", "补水", "效果", "好", "还", "可以", "心", "  ", "得", ":", "补水", "效果", "不错", ",", "很", "好", "用"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "是", "正品", "补水", "效果", "好", "还", "可以", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "补水", "效果", "不错", ",", "很", "好", "用"] 优  点:东西很好哦!不  足:暂时还没有发现缺点哦!心  得:一直在用,信任京东,感觉不错,下次再来。。 -["优", "  ", "点", ":", "东西", "很", "好", "哦", "!", "不", "  ", "足", ":", "暂时", "还", "没有", "发现", "缺点", "哦", "!", "心", "  ", "得", ":", "一直", "在", "用", ",", "信任", "京东", ",", "感觉", "不错", ",", "下次", "再", "来", "。", "。"] +["优", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "点", ":", "东西", "很", "好", "哦", "!", "不", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "足", ":", "暂时", "还", "没有", "发现", "缺点", "哦", "!", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "在", "用", ",", "信任", "京东", ",", "感觉", "不错", ",", "下次", "再", "来", "。", "。"] 标  签:皮肤滑滑的味道不错价格实惠保湿还不错乳液很好用心  得:用的很好的下次还会购买 -["标", "  ", "签", ":", "皮肤", "滑", "滑", "的", "味道", "不错", "价格", "实惠", "保湿", "还", "不错", "乳液", "很", "好", "用心", "  ", "得", ":", "用", "的", "很", "好", "的", "下次", "还", "会", "购买"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "皮肤", "滑", "滑", "的", "味道", "不错", "价格", "实惠", "保湿", "还", "不错", "乳液", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "用", "的", "很", "好", "的", "下次", "还", "会", "购买"] 标  签:很好用皮肤滑滑的心  得:好用啊,一如既往的好用 -["标", "  ", "签", ":", "很", "好", "用", "皮肤", "滑", "滑", "的", "心", "  ", "得", ":", "好", "用", "啊", ",", "一如既往", "的", "好", "用"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "很", "好", "用", "皮肤", "滑", "滑", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "好", "用", "啊", ",", "一如既往", "的", "好", "用"] 心  得:买了以后就知道不后悔的呢 -["心", "  ", "得", ":", "买", "了", "以后", "就", "知道", "不", "后悔", "的", "呢"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "买", "了", "以后", "就", "知道", "不", "后悔", "的", "呢"] 心  得:非常满意,五星 -["心", "  ", "得", ":", "非常", "满意", ",", "五星"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "非常", "满意", ",", "五星"] 心  得:非常满意,五星 -["心", "  ", "得", ":", "非常", "满意", ",", "五星"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "非常", "满意", ",", "五星"] 心  得:非常满意,五星 -["心", "  ", "得", ":", "非常", "满意", ",", "五星"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "非常", "满意", ",", "五星"] 心  得:宝贝很喜欢,连作业都不肯做,在那儿看呢,呵呵 -["心", "  ", "得", ":", "宝贝", "很", "喜欢", ",", "连", "作业", "都", "不肯", "做", ",", "在", "那儿", "看", "呢", ",", "呵呵"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "宝贝", "很", "喜欢", ",", "连", "作业", "都", "不肯", "做", ",", "在", "那儿", "看", "呢", ",", "呵呵"] 心  得:非常满意,五星 -["心", "  ", "得", ":", "非常", "满意", ",", "五星"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "非常", "满意", ",", "五星"] 心  得:非常满意,五星 -["心", "  ", "得", ":", "非常", "满意", ",", "五星"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "非常", "满意", ",", "五星"] 心  得:非常满意,五星 -["心", "  ", "得", ":", "非常", "满意", ",", "五星"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "非常", "满意", ",", "五星"] 心  得:非常满意,五星 -["心", "  ", "得", ":", "非常", "满意", ",", "五星"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "非常", "满意", ",", "五星"] 标  签:服务好很好用心  得:不错,正品,还会继续关注 -["标", "  ", "签", ":", "服务", "好", "很", "好", "用心", "  ", "得", ":", "不错", ",", "正品", ",", "还", "会", "继续", "关注"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "服务", "好", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不错", ",", "正品", ",", "还", "会", "继续", "关注"] 标  签:乳液很好用心  得:比较滋润还不错。。。。。。。。。。 -["标", "  ", "签", ":", "乳液", "很", "好", "用心", "  ", "得", ":", "比较", "滋润", "还", "不错", "。", "。", "。", "。", "。", "。", "。", "。", "。", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "乳液", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "比较", "滋润", "还", "不错", "。", "。", "。", "。", "。", "。", "。", "。", "。", "。"] 标  签:品牌好心  得:送货快,还没有用,具体效果还不清楚 -["标", "  ", "签", ":", "品牌", "好心", "  ", "得", ":", "送货", "快", ",", "还", "没有", "用", ",", "具体", "效果", "还", "不", "清楚"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "品牌", "好心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "送货", "快", ",", "还", "没有", "用", ",", "具体", "效果", "还", "不", "清楚"] 标  签:很好用心  得:一直用这个,在京东买方便。 -["标", "  ", "签", ":", "很", "好", "用心", "  ", "得", ":", "一直", "用", "这个", ",", "在", "京东", "买", "方便", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "用", "这个", ",", "在", "京东", "买", "方便", "。"] 标  签:保湿还不错包装好脸上很舒服吸收快物流速度快心  得:必须要说的是,这是我老婆自己买的。 -["标", "  ", "签", ":", "保湿", "还", "不错", "包装", "好", "脸上", "很", "舒服", "吸收", "快", "物流", "速度", "快", "心", "  ", "得", ":", "必须", "要说", "的", "是", ",", "这", "是", "我", "老婆", "自己", "买", "的", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "保湿", "还", "不错", "包装", "好", "脸上", "很", "舒服", "吸收", "快", "物流", "速度", "快", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "必须", "要说", "的", "是", ",", "这", "是", "我", "老婆", "自己", "买", "的", "。"] 标  签:效果不错心  得:一直用这个存货中************** -["标", "  ", "签", ":", "效果", "不错", "心", "  ", "得", ":", "一直", "用", "这个", "存货", "中", "**************"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "效果", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "用", "这个", "存货", "中", "*", "*", "*", "*", "*", "*", "*", "*", "*", "*", "*", "*", "*", "*"] 标  签:很好用心  得:还可以,常规的东东。. -["标", "  ", "签", ":", "很", "好", "用心", "  ", "得", ":", "还", "可以", ",", "常规", "的", "东东", "。", "."] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "还", "可以", ",", "常规", "的", "东东", "。", "."] 标  签:包装好乳液很好用补水效果好物流速度快价格实惠心  得:挺好的,脸上不紧绷,舒服 -["标", "  ", "签", ":", "包装", "好", "乳液", "很", "好", "用", "补水", "效果", "好", "物流", "速度", "快", "价格", "实惠", "心", "  ", "得", ":", "挺", "好", "的", ",", "脸上", "不", "紧", "绷", ",", "舒服"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "包装", "好", "乳液", "很", "好", "用", "补水", "效果", "好", "物流", "速度", "快", "价格", "实惠", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "挺", "好", "的", ",", "脸上", "不", "紧", "绷", ",", "舒服"] 标  签:物流速度快价格实惠心  得:应该是正品吧,价格比超市便宜些。正在使用中 -["标", "  ", "签", ":", "物流", "速度", "快", "价格", "实惠", "心", "  ", "得", ":", "应该", "是", "正品", "吧", ",", "价格比", "超市", "便宜", "些", "。", "正在", "使用", "中"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "物流", "速度", "快", "价格", "实惠", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "应该", "是", "正品", "吧", ",", "价格比", "超市", "便宜", "些", "。", "正在", "使用", "中"] 标  签:还可以心  得:挺滋润的,价钱也合适! -["标", "  ", "签", ":", "还", "可以", "心", "  ", "得", ":", "挺", "滋润", "的", ",", "价钱", "也", "合适", "!"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "还", "可以", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "挺", "滋润", "的", ",", "价钱", "也", "合适", "!"] 标  签:是正品效果不错心  得:用过以后效果挺好的,不错是正品 -["标", "  ", "签", ":", "是", "正品", "效果", "不错", "心", "  ", "得", ":", "用", "过", "以后", "效果", "挺", "好", "的", ",", "不错", "是", "正品"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "是", "正品", "效果", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "用", "过", "以后", "效果", "挺", "好", "的", ",", "不错", "是", "正品"] 标  签:很好用比商场便宜心  得:用这个产品一年了,比较认可。 -["标", "  ", "签", ":", "很", "好", "用", "比", "商场", "便宜", "心", "  ", "得", ":", "用", "这个", "产品", "一年", "了", ",", "比较", "认可", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "很", "好", "用", "比", "商场", "便宜", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "用", "这个", "产品", "一年", "了", ",", "比较", "认可", "。"] 标  签:保湿还不错心  得:第一次用乳液,感觉还不错 -["标", "  ", "签", ":", "保湿", "还", "不错", "心", "  ", "得", ":", "第一次", "用", "乳液", ",", "感觉", "还", "不错"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "保湿", "还", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "第一次", "用", "乳液", ",", "感觉", "还", "不错"] 标  签:价格实惠心  得:便宜,东西还行吧,用着不习惯,感觉有酒精 -["标", "  ", "签", ":", "价格", "实惠", "心", "  ", "得", ":", "便宜", ",", "东西", "还", "行", "吧", ",", "用", "着", "不", "习惯", ",", "感觉", "有", "酒精"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "价格", "实惠", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "便宜", ",", "东西", "还", "行", "吧", ",", "用", "着", "不", "习惯", ",", "感觉", "有", "酒精"] 标  签:价格实惠包装好心  得:看牌子买的,先试着用用看效果 -["标", "  ", "签", ":", "价格", "实惠", "包装", "好心", "  ", "得", ":", "看", "牌子", "买", "的", ",", "先", "试", "着", "用", "用", "看", "效果"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "价格", "实惠", "包装", "好心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "看", "牌子", "买", "的", ",", "先", "试", "着", "用", "用", "看", "效果"] 心  得:配套用的不错个人觉得 -["心", "  ", "得", ":", "配套", "用", "的", "不错", "个人", "觉得"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "配套", "用", "的", "不错", "个人", "觉得"] 标  签:味道刺激心  得:不怎么样,用后脸上会起红点 -["标", "  ", "签", ":", "味道", "刺激", "心", "  ", "得", ":", "不怎么样", ",", "用", "后", "脸上", "会", "起", "红", "点"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "味道", "刺激", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不怎么样", ",", "用", "后", "脸上", "会", "起", "红", "点"] 标  签:挺保湿的物流速度快比商场便宜品牌好心  得:正品,平价,比商场便宜,物流很快。 -["标", "  ", "签", ":", "挺", "保湿", "的", "物流", "速度", "快", "比", "商场", "便宜", "品牌", "好心", "  ", "得", ":", "正品", ",", "平价", ",", "比", "商场", "便宜", ",", "物流", "很快", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "挺", "保湿", "的", "物流", "速度", "快", "比", "商场", "便宜", "品牌", "好心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "正品", ",", "平价", ",", "比", "商场", "便宜", ",", "物流", "很快", "。"] 标  签:服务好心  得:还没有使用过,就发现YMX只要79元,我哭!为什么京东价格拼不过YMX呀~~~ -["标", "  ", "签", ":", "服务", "好心", "  ", "得", ":", "还", "没有", "使用", "过", ",", "就", "发现", "YMX", "只要", "79", "元", ",", "我", "哭", "!", "为什么", "京东", "价格", "拼", "不过", "YMX", "呀", "~~~"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "服务", "好心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "还", "没有", "使用", "过", ",", "就", "发现", "Y", "M", "X", "只要", "7", "9", "元", ",", "我", "哭", "!", "为什么", "京东", "价格", "拼", "不过", "Y", "M", "X", "呀", "~", "~", "~"] 标  签:挺保湿的心  得:第一次购买,用了感觉还不错 -["标", "  ", "签", ":", "挺", "保湿", "的", "心", "  ", "得", ":", "第一次", "购买", ",", "用", "了", "感觉", "还", "不错"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "挺", "保湿", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "第一次", "购买", ",", "用", "了", "感觉", "还", "不错"] 标  签:服务好物流速度快脸上很舒服心  得:刚送到家。。用用在发表好坏。 -["标", "  ", "签", ":", "服务", "好", "物流", "速度", "快", "脸上", "很", "舒服", "心", "  ", "得", ":", "刚", "送到", "家", "。", "。", "用", "用", "在", "发表", "好坏", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "服务", "好", "物流", "速度", "快", "脸上", "很", "舒服", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "刚", "送到", "家", "。", "。", "用", "用", "在", "发表", "好坏", "。"] 心  得:还没用看看包装蛮好的晒  单:共3张图片查看晒单> -["心", "  ", "得", ":", "还", "没用", "看看", "包装", "蛮", "好", "的", "晒", "  ", "单", ":", "共", "3", "张", "图片", "查看", "晒", "单", ">"] +["心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "还", "没用", "看看", "包装", "蛮", "好", "的", "晒", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "单", ":", "共", "3", "张", "图片", "查看", "晒", "单", ">"] 标  签:品牌好价格实惠脸上很舒服味道不错心  得:防晒,不油腻,还可以使皮肤稍稍增白些, -["标", "  ", "签", ":", "品牌", "好", "价格", "实惠", "脸上", "很", "舒服", "味道", "不错", "心", "  ", "得", ":", "防晒", ",", "不", "油腻", ",", "还", "可以", "使", "皮肤", "稍稍", "增白", "些", ","] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "品牌", "好", "价格", "实惠", "脸上", "很", "舒服", "味道", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "防晒", ",", "不", "油腻", ",", "还", "可以", "使", "皮肤", "稍稍", "增白", "些", ","] 标  签:价格实惠保湿还不错心  得:东西好用,分不清楚是不是正品。 -["标", "  ", "签", ":", "价格", "实惠", "保湿", "还", "不错", "心", "  ", "得", ":", "东西", "好", "用", ",", "分", "不", "清楚", "是不是", "正品", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "价格", "实惠", "保湿", "还", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "东西", "好", "用", ",", "分", "不", "清楚", "是不是", "正品", "。"] 标  签:服务好乳液很好用心  得:乳液还是不错的用用不错的 -["标", "  ", "签", ":", "服务", "好", "乳液", "很", "好", "用心", "  ", "得", ":", "乳液", "还是", "不错", "的", "用", "用", "不错", "的"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "服务", "好", "乳液", "很", "好", "用心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "乳液", "还是", "不错", "的", "用", "用", "不错", "的"] 标  签:物流速度快效果不错心  得:常用这个,夏天用,美白效果还好 -["标", "  ", "签", ":", "物流", "速度", "快", "效果", "不错", "心", "  ", "得", ":", "常用", "这个", ",", "夏天", "用", ",", "美", "白", "效果", "还好"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "物流", "速度", "快", "效果", "不错", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "常用", "这个", ",", "夏天", "用", ",", "美", "白", "效果", "还好"] 标  签:还可以心  得:不错 -["标", "  ", "签", ":", "还", "可以", "心", "  ", "得", ":", "不错"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "还", "可以", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "不错"] 标  签:价格实惠比商场便宜服务好心  得:真的还不错而且价格也实惠快递速度 -["标", "  ", "签", ":", "价格", "实惠", "比", "商场", "便宜", "服务", "好心", "  ", "得", ":", "真的", "还", "不错", "而且", "价格", "也", "实惠", "快递", "速度"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "价格", "实惠", "比", "商场", "便宜", "服务", "好心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "真的", "还", "不错", "而且", "价格", "也", "实惠", "快递", "速度"] 标  签:比商场便宜脸上很舒服很好用物流速度快是正品心  得:京东就是好一日既往的好 -["标", "  ", "签", ":", "比", "商场", "便宜", "脸上", "很", "舒服", "很", "好", "用", "物流", "速度", "快", "是", "正品", "心", "  ", "得", ":", "京东", "就是", "好", "一日", "既往", "的", "好"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "比", "商场", "便宜", "脸上", "很", "舒服", "很", "好", "用", "物流", "速度", "快", "是", "正品", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "京东", "就是", "好", "一日", "既往", "的", "好"] 活动时购买的很划算,用下来觉得还可以吧,等用完了才能知道有没有效果吧。反正很划算,随便用用看 ["活动", "时", "购买", "的", "很", "划算", ",", "用", "下来", "觉得", "还", "可以", "吧", ",", "等", "用", "完", "了", "才能", "知道", "有没有", "效果", "吧", "。", "反正", "很", "划算", ",", "随便", "用", "用", "看"] 新能真皙美白乳液很好用,有美白的效果,吸收也很快,搞活动买的,比外面便宜好多~~~~~ -["新", "能", "真", "皙", "美", "白", "乳液", "很", "好", "用", ",", "有", "美", "白", "的", "效果", ",", "吸收", "也", "很快", ",", "搞", "活动", "买", "的", ",", "比", "外面", "便宜", "好多", "~~~~~"] +["新", "能", "真", "皙", "美", "白", "乳液", "很", "好", "用", ",", "有", "美", "白", "的", "效果", ",", "吸收", "也", "很快", ",", "搞", "活动", "买", "的", ",", "比", "外面", "便宜", "好多", "~", "~", "~", "~", "~"] 三八妇女节买的,Z的产品随便用用可以的。女人要对自己好一点。 ["三八妇女节", "买", "的", ",", "Z", "的", "产品", "随便", "用", "用", "可以", "的", "。", "女人", "要", "对", "自己", "好", "一点", "。"] 标  签:是正品挺保湿的心  得:好东东,ZA我的最爱。 -["标", "  ", "签", ":", "是", "正品", "挺", "保湿", "的", "心", "  ", "得", ":", "好", "东东", ",", "ZA", "我", "的", "最", "爱", "。"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "是", "正品", "挺", "保湿", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "好", "东东", ",", "Z", "A", "我", "的", "最", "爱", "。"] 优  点:没有让这次的尝试失望不  足:货运慢,慢,慢心  得:很舒适,用的不错 -["优", "  ", "点", ":", "没有", "让", "这次", "的", "尝试", "失望", "不", "  ", "足", ":", "货运", "慢", ",", "慢", ",", "慢", "心", "  ", "得", ":", "很", "舒适", ",", "用", "的", "不错"] +["优", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "点", ":", "没有", "让", "这次", "的", "尝试", "失望", "不", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "足", ":", "货运", "慢", ",", "慢", ",", "慢", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "很", "舒适", ",", "用", "的", "不错"] 标  签:挺保湿的心  得:一直用还可以~~~~~~~~~~~~~~~~ -["标", "  ", "签", ":", "挺", "保湿", "的", "心", "  ", "得", ":", "一直", "用", "还", "可以", "~~~~~~~~~~~~~~~~"] +["标", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "签", ":", "挺", "保湿", "的", "心", "&", "#", "1", "2", "2", "8", "8", ";", "&", "#", "1", "2", "2", "8", "8", ";", "得", ":", "一直", "用", "还", "可以", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~", "~"] 很滋润效果好味道接受 ["很", "滋润", "效果", "好", "味道", "接受"] 朋友推荐,醇润型,有点稠,我是混合型皮肤,很好吸收,不粘腻 @@ -173,13 +173,13 @@ 效果挺好的滋润保湿了味道清淡 ["效果", "挺", "好", "的", "滋润", "保湿", "了", "味道", "清淡"] 瓶子盖子都有刮痕了,是不是都用过了啊。以前也在卓越买过za的其他化妆品,都还算满意。这一次真觉得很恶心,以后不会在这买了 -["瓶子", "盖子", "都", "有", "刮", "痕", "了", ",", "是不是", "都", "用", "过", "了", "啊", "。", "以前", "也", "在", "卓越", "买", "过", "za", "的", "其他", "化妆品", ",", "都", "还", "算", "满意", "。", "这", "一次", "真", "觉得", "很", "恶心", ",", "以后", "不会", "在", "这", "买", "了"] +["瓶子", "盖子", "都", "有", "刮", "痕", "了", ",", "是不是", "都", "用", "过", "了", "啊", "。", "以前", "也", "在", "卓越", "买", "过", "z", "a", "的", "其他", "化妆品", ",", "都", "还", "算", "满意", "。", "这", "一次", "真", "觉得", "很", "恶心", ",", "以后", "不会", "在", "这", "买", "了"] 好用不知道是不是正品啊 ["好", "用", "不", "知道", "是不是", "正品", "啊"] 很好用 ["很", "好", "用"] za乳液不够滋润,全新但是怎么没有密封? -["za", "乳液", "不够", "滋润", ",", "全新", "但是", "怎么", "没有", "密封", "?"] +["z", "a", "乳液", "不够", "滋润", ",", "全新", "但是", "怎么", "没有", "密封", "?"] 还不错,一直在用 ["还", "不错", ",", "一直", "在", "用"] 妈妈收到了 @@ -193,7 +193,7 @@ za乳液不够滋润,全新但是怎么没有密封? 还可以 ["还", "可以"] 挺好的,这个用上也不是很油腻.. -["挺", "好", "的", ",", "这个", "用", "上", "也", "不是", "很", "油腻", ".."] +["挺", "好", "的", ",", "这个", "用", "上", "也", "不是", "很", "油腻", ".", "."] 纯度不够。 ["纯度", "不够", "。"] 这个给婆婆买的,我就用过几次,但感觉挺滋润 diff --git a/test/unittest/TKeywordExtractor.cpp b/test/unittest/TKeywordExtractor.cpp index 4363fb5..5b62303 100644 --- a/test/unittest/TKeywordExtractor.cpp +++ b/test/unittest/TKeywordExtractor.cpp @@ -8,11 +8,11 @@ using namespace CppJieba; TEST(KeywordExtractorTest, Test1) { KeywordExtractor extractor("../dict/extra_dict/jieba.dict.small.utf8", "../dict/hmm_model.utf8", "../dict/idf.utf8", "../dict/stop_words.utf8"); - string s("我是拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上总经理,迎娶白富美,走上人生巅峰。"); + string s("我是拖拉机学院手扶拖拉机专业的。不用多久,我就会升职加薪,当上CEO,走上人生巅峰。"); string res; vector > wordweights; size_t topN = 5; extractor.extract(s, wordweights, topN); res << wordweights; - ASSERT_EQ(res, "[\"白富美:11.7392\", \"升职:10.8562\", \"加薪:10.6426\", \"迎娶:10.0505\", \"手扶拖拉机:10.0089\"]"); + ASSERT_EQ(res, "[\"CEO:11.7392\", \"升职:10.8562\", \"加薪:10.6426\", \"手扶拖拉机:10.0089\", \"巅峰:9.49396\"]"); } diff --git a/test/unittest/TSegments.cpp b/test/unittest/TSegments.cpp index bfe8ea7..9986d71 100644 --- a/test/unittest/TSegments.cpp +++ b/test/unittest/TSegments.cpp @@ -9,30 +9,31 @@ using namespace CppJieba; -TEST(SegmentBaseTest, Test1) -{ - const char* str = "heheh你好...hh"; - string s; - vector buf; - buf.push_back("heheh"); - buf.push_back("你好"); - buf.push_back("...hh"); - vector res; - size_t size = strlen(str); - size_t offset = 0; - while(offset < size) - { - size_t len = 0; - const char* t = str + offset; - SegmentBase::filterAscii(t, size - offset, len); - s.assign(t, len); - res.push_back(s); - //cout< buf; +// buf.push_back("heheh"); +// buf.push_back("你好"); +// buf.push_back("...hh"); +// vector res; +// size_t size = strlen(str); +// size_t offset = 0; +// while(offset < size) +// { +// size_t len = 0; +// const char* t = str + offset; +// SegmentBase::filterAscii(t, size - offset, len); +// s.assign(t, len); +// res.push_back(s); +// //cout< words; ASSERT_TRUE(segment); ASSERT_TRUE(segment.cut(str, words)); - EXPECT_EQ(words, vector(res, res + sizeof(res)/sizeof(res[0]))); + ASSERT_EQ(words, vector(res, res + sizeof(res)/sizeof(res[0]))); } TEST(MPSegmentTest, Test1) { MPSegment segment("../dict/extra_dict/jieba.dict.small.utf8");; - const char* str = "我来自北京邮电大学。。。 学号 123456"; - const char* res[] = {"我", "来自", "北京邮电大学", "。","。","。"," ","学","号", " 123456"}; + const char* str = "我来自北京邮电大学。"; + const char* res[] = {"我", "来自", "北京邮电大学", "。"}; vector words; ASSERT_TRUE(segment); ASSERT_TRUE(segment.cut(str, words)); //print(words); - EXPECT_EQ(words, vector(res, res + sizeof(res)/sizeof(res[0]))); + ASSERT_EQ(words, vector(res, res + sizeof(res)/sizeof(res[0]))); } TEST(MPSegmentTest, Test2) @@ -93,28 +94,25 @@ TEST(MPSegmentTest, Test2) TEST(HMMSegmentTest, Test1) { HMMSegment segment("../dict/hmm_model.utf8");; - const char* str = "我来自北京邮电大学。。。 学号 123456"; - const char* res[] = {"我来", "自北京", "邮电大学", "。", "。", "。", " ", "学号", " 123456"}; - //string s; - //vector buf(res, res + sizeof(res)/sizeof(res[0])); + const char* str = "我来自北京邮电大学。。。学号123456"; + const char* res[] = {"我来", "自北京", "邮电大学", "。", "。", "。", "学号", "123456"}; vector words; ASSERT_TRUE(segment); ASSERT_TRUE(segment.cut(str, words)); - //print(words); - EXPECT_EQ(words, vector(res, res + sizeof(res)/sizeof(res[0]))); + ASSERT_EQ(words, vector(res, res + sizeof(res)/sizeof(res[0]))); } TEST(FullSegment, Test1) { FullSegment segment("../dict/extra_dict/jieba.dict.small.utf8"); - const char* str = "我来自北京邮电大学。。。 学号 123456"; + const char* str = "我来自北京邮电大学"; vector words; ASSERT_EQ(segment.cut(str, words), true); string s; s << words; - ASSERT_EQ(s, "[\"我\", \"来自\", \"北京\", \"北京邮电大学\", \"邮电\", \"电大\", \"大学\", \"。\", \"。\", \"。\", \" \", \"学\", \"号\", \" 123456\"]"); + ASSERT_EQ(s, "[\"我\", \"来自\", \"北京\", \"北京邮电大学\", \"邮电\", \"电大\", \"大学\"]"); } TEST(QuerySegment, Test1)