cppjieba/ChangeLog.md
2014-03-18 11:51:04 -05:00

43 lines
1.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## v2.3.5 is coming
1. 适配低级版本的`g++`,已在`g++ 4.4.7`上测试通过。
## v2.3.4
1. 修改了设计上的问题,删除了`TrieManager`这个类,以避免造成一些可能的隐患。
2. 增加`stop_words.utf8`词典,并修改`KeywordExtractor`的初始化函数用以使用此词典。
3. 优化了Trie树相关部分代码结构。
## v2.3.3
1. 修复因为使用unordered_map导致的在不同机器上结果不一致的问题。
2. 将部分数据结果从unordered_map改为map提升了差不多1/6的切词速度。(因为unordered_map虽然查找速度快但是在范围迭代的效率较低。)
## v2.3.2
1. 修复单元测试的问题有些case在x84和x64中结果不一致。
2. merge进词性标注的简单版本。
## v2.3.1
1. 修复安装时的服务启动问题不过安装切词服务只是linux下的一个附加功能不影响核心代码。
## v2.3.0
1. 增加`KeywordExtractor.hpp`来进行关键词抽取。
2. 使用`gtest`来做单元测试。
## v2.2.0
1. 性能优化提升切词速度约6倍。
2. 其他暂时也想不起来了。
## v2.1.1 (v2.1.1之前的统统一起写在 v2.1.1里面了)
1. 完成__最大概率分词算法__和__HMM分词算法__并且将他们结合起来成效果最好的`MixSegment`
2. 进行大量的代码重构将主要的功能性代码都写成了hpp文件。
3. 使用`cmake`工具来管理项目。
4. 使用`Limonp`作为工具函数库,比如日志,字符串操作等常用函数。
5. 使用`Husky` 搭简易分词服务的服务器框架。