cppjieba/ChangeLog.md
2014-04-25 22:34:22 +08:00

2.2 KiB
Raw Blame History

CppJieba ChangeLog

v2.4.1 (is coming)

  1. 完善一些特殊字符和字母串的切词效果。
  2. 提高关键词抽取的速度。
  3. 提供用户自定义词典的接口。
  4. 将server相关的代码独立出来单独放在server/目录下。

v2.4.0

  1. 适配更低级版本的g++cmake,已在g++ 4.1.2cmake 2.6上测试通过。
  2. 修改一些测试用例的文件,减少测试时编译的时间。
  3. 修复make install相关的问题。
  4. 增加HTTP服务的POST请求接口。
  5. 拆分Trie.hppDictTrie.hppTrie.hpp将trie树这个数据结构抽象出来并且修复Trie这个类潜在的bug并完善单元测试。
  6. 重写cjserver的启动和停止新启动和停止方法详见README.md。

v2.3.4

  1. 修改了设计上的问题,删除了TrieManager这个类,以避免造成一些可能的隐患。
  2. 增加stop_words.utf8词典,并修改KeywordExtractor的初始化函数用以使用此词典。
  3. 优化了Trie树相关部分代码结构。

v2.3.3

  1. 修复因为使用unordered_map导致的在不同机器上结果不一致的问题。
  2. 将部分数据结果从unordered_map改为map提升了差不多1/6的切词速度。(因为unordered_map虽然查找速度快但是在范围迭代的效率较低。)

v2.3.2

  1. 修复单元测试的问题有些case在x84和x64中结果不一致。
  2. merge进词性标注的简单版本。

v2.3.1

  1. 修复安装时的服务启动问题不过安装切词服务只是linux下的一个附加功能不影响核心代码。

v2.3.0

  1. 增加KeywordExtractor.hpp来进行关键词抽取。
  2. 使用gtest来做单元测试。

v2.2.0

  1. 性能优化提升切词速度约6倍。
  2. 其他暂时也想不起来了。

v2.1.1 (v2.1.1之前的统统一起写在 v2.1.1里面了)

  1. 完成__最大概率分词算法__和__HMM分词算法__并且将他们结合起来成效果最好的MixSegment
  2. 进行大量的代码重构将主要的功能性代码都写成了hpp文件。
  3. 使用cmake工具来管理项目。
  4. 使用Limonp作为工具函数库,比如日志,字符串操作等常用函数。
  5. 使用Husky 搭简易分词服务的服务器框架。