fix hit.java with the correct encoding

This commit is contained in:
medcl 2013-03-05 21:57:33 +08:00
parent 29b6454817
commit 5f5dcf065d
15 changed files with 14 additions and 278007 deletions

View File

@ -1,6 +1,6 @@
/**
*
* IK 中文分词 版本 5.0
* IK 中文分词 版本 5.0
* IK Analyzer release 5.0
*
* Licensed to the Apache Software Foundation (ASF) under one or more
@ -18,42 +18,42 @@
* See the License for the specific language governing permissions and
* limitations under the License.
*
* 源代码由林良益(linliangyi2005@gmail.com)提供
* 版权声明 2012乌龙茶工作室
* 源代码由林良益(linliangyi2005@gmail.com)提供
* 版权声明 2012乌龙茶工作室
* provided by Linliangyi and copyright 2012 by Oolong studio
*
*/
package org.wltea.analyzer.dic;
/**
* 表示一次词典匹配的命中
* 表示一次词典匹配的命中
*/
public class Hit {
//Hit不匹配
//Hit不匹配
private static final int UNMATCH = 0x00000000;
//Hit完全匹配
//Hit完全匹配
private static final int MATCH = 0x00000001;
//Hit前缀匹配
//Hit前缀匹配
private static final int PREFIX = 0x00000010;
//该HIT当前状态默认未匹配
//该HIT当前状态默认未匹配
private int hitState = UNMATCH;
//记录词典匹配过程中当前匹配到的词典分支节点
//记录词典匹配过程中当前匹配到的词典分支节点
private DictSegment matchedDictSegment;
/*
* 词段开始位置
* 词段开始位置
*/
private int begin;
/*
* 词段的结束位置
* 词段的结束位置
*/
private int end;
/**
* 判断是否完全匹配
* 判断是否完全匹配
*/
public boolean isMatch() {
return (this.hitState & MATCH) > 0;
@ -64,7 +64,7 @@ public class Hit {
}
/**
* 判断是否是词的前缀
* 判断是否是词的前缀
*/
public boolean isPrefix() {
return (this.hitState & PREFIX) > 0;
@ -74,7 +74,7 @@ public class Hit {
this.hitState = this.hitState | PREFIX;
}
/**
* 判断是否是不匹配
* 判断是否是不匹配
*/
public boolean isUnmatch() {
return this.hitState == UNMATCH ;

View File

@ -1,43 +0,0 @@
/*
* Licensed to Elastic Search and Shay Banon under one
* or more contributor license agreements. See the NOTICE file
* distributed with this work for additional information
* regarding copyright ownership. Elastic Search licenses this
* file to you under the Apache License, Version 2.0 (the
* "License"); you may not use this file except in compliance
* with the License. You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing,
* software distributed under the License is distributed on an
* "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
* KIND, either express or implied. See the License for the
* specific language governing permissions and limitations
* under the License.
*/
/**
*
*/
import org.wltea.analyzer.help.CharacterHelper;
/**
* @author Administrator
*
*/
public class CharacterTest {
public void testSBC2DBCChar(){
char a = '';
System.out.println((int)a);
System.out.println(CharacterHelper.regularize(a));
System.out.println((int)CharacterHelper.regularize(a));
String sss = "智灵通乳酸钙冲剂(5g\14袋)-1244466518522.txt";
System.out.println(sss.replaceAll("[\\\\]", ""));
}
}

View File

@ -1,481 +0,0 @@
///**
// *
// */
//
//import org.wltea.analyzer.dic.DictSegment;
//import org.wltea.analyzer.dic.Dictionary;
//import org.wltea.analyzer.dic.Hit;
//
//import java.io.BufferedReader;
//import java.io.FileOutputStream;
//import java.io.IOException;
//import java.io.InputStream;
//import java.io.InputStreamReader;
//import java.util.ArrayList;
//import java.util.Date;
//import java.util.HashMap;
//import java.util.List;
//import java.util.Map;
//import java.util.Set;
//import java.util.TreeSet;
//
///**
// * 主词典统计分析工具类
// * @author 林良益
// *
// */
//public class DictionaryTester {
//
// public void testMainDicEncoding(){
// int count = 0;
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_MAIN);
// try {
//
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is,"UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// theWord = theWord.trim();
// /*Test Logging*/
// System.out.println(theWord);
// }
// count++;
// } while (theWord != null && count < 20);
//
// } catch (IOException ioe) {
// System.err.println("主词典库载入异常.");
// ioe.printStackTrace();
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
// }
//
// public void testMainDictMemoryConsume(){
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_MAIN);
// System.out.println(new Date() + " before load dictionary");
// DictSegment _root_ = new DictSegment((char)0);
// try {
// Thread.sleep(20000);
// } catch (InterruptedException e1) {
//
// e1.printStackTrace();
// }
// System.out.println(new Date() + " loading dictionary");
// try {
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// _root_.fillSegment(theWord.toCharArray());
// }
// } while (theWord != null);
// System.out.println(new Date() + " after load dictionary");
//
//
// } catch (IOException ioe) {
// System.err.println("主词典库载入异常.");
// ioe.printStackTrace();
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
//
// try {
// Thread.sleep(20000);
// } catch (InterruptedException e1) {
//
// e1.printStackTrace();
// }
// }
//
// public void testCountWordHeader(){
// FileOutputStream fos = null;
// Map<String , Integer> wordMap = new HashMap<String ,Integer>();
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_MAIN);
//
// try {
// fos = new FileOutputStream("D:/testCountWordHeader.txt");
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// theWord = theWord.trim();
// String key = theWord.substring(0,1);
// Integer c = wordMap.get(key);
// if(c == null){
// wordMap.put(key, new Integer(1));
// }else{
// wordMap.put(key, ++c);
// }
// }
// } while (theWord != null);
//
// int countOnlyOne = 0;
// int countMorethan64 = 0;
// Set<String> it = wordMap.keySet();
// for(String key : it){
// Integer c = wordMap.get(key);
// if(c == 1){
// countOnlyOne ++;
// }
// if(c > 64){
// countMorethan64 ++;
// }
//
// fos.write((key + " : " + c + "\r\n").getBytes());
// }
// fos.write(("Total : " + wordMap.size() + "\r\n").getBytes());
// fos.write(("OnlyOneCount : " + countOnlyOne + "\r\n").getBytes());
// fos.write(("MoreThen64Count : " + countMorethan64 + "\r\n").getBytes());
// fos.flush();
//
// } catch (IOException ioe) {
// System.err.println("主词典库载入异常.");
// ioe.printStackTrace();
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// try {
// if(fos != null){
// fos.close();
// fos = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
// }
//
// public void testSurNameDicEncoding(){
// int count = 0;
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_SURNAME);
// try {
//
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// theWord = theWord.trim();
// /*Test Logging*/
// System.out.println(theWord);
// }
// count++;
// } while (theWord != null && count < 20);
//
// } catch (IOException ioe) {
// System.err.println("姓氏典库载入异常.");
// ioe.printStackTrace();
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
// }
//
// public void testSuffixDicEncoding(){
// int count = 0;
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_SUFFIX);
// try {
//
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// theWord = theWord.trim();
// /*Test Logging*/
// System.out.println(theWord);
// }
// count++;
// } while (theWord != null && count < 20);
//
// } catch (IOException ioe) {
// System.err.println("后缀典库载入异常.");
// ioe.printStackTrace();
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
// }
//
// public void testStopDicEncoding(){
// int count = 0;
//
// InputStream is = DictionaryTester.class.getResourceAsStream("/mydict.dic");
// try {
//
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// theWord = theWord.trim();
// /*Test Logging*/
// System.out.println(theWord);
// }
// count++;
// } while (theWord != null);
//
// } catch (IOException ioe) {
// System.err.println("停止词典库载入异常.");
// ioe.printStackTrace();
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
// }
//
//
// public void testDictSegmentSearch(){
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_QUANTIFIER);
// System.out.println(new Date() + " before load dictionary");
//
// DictSegment _root_ = new DictSegment((char)0);
// List<String> allWords = new ArrayList<String>();
//
// System.out.println(new Date() + " loading dictionary");
// try {
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// allWords.add(theWord.trim());
// _root_.fillSegment(theWord.trim().toCharArray());
// }
// } while (theWord != null);
// System.out.println(new Date() + " after load dictionary");
//
//
// } catch (IOException ioe) {
// System.err.println("主词典库载入异常.");
// ioe.printStackTrace();
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
//
// try {
// Thread.sleep(3000);
// } catch (InterruptedException e1) {
//
// e1.printStackTrace();
// }
//
// System.out.println(new Date() + " begin march");
// long begintime = System.currentTimeMillis();
// Hit hit = null;
// int umCount = 0;
// int mCount = 0;
// for(String word : allWords){
// hit = _root_.match(word.toCharArray());
// if(hit.isUnmatch()){
// System.out.println(word);
// umCount++;
// }else{
// mCount++;
// System.out.println(mCount + " : " + word);
// }
// }
// System.out.println(new Date() + " finish march , cost " + (System.currentTimeMillis() - begintime ) + " millseconds");
// System.out.println("Match words : " + mCount + " Unmatch words : " + umCount);
// }
//
// public void testDictionarySearch(){
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_MAIN);
// List<String> allWords = new ArrayList<String>();
//
// try {
// String theWord = null;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// allWords.add(theWord.trim());
// }
// } while (theWord != null);
//
// } catch (IOException ioe) {
// ioe.printStackTrace();
//
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
//
// Dictionary.getInstance();
// try {
// Thread.sleep(3000);
// } catch (InterruptedException e1) {
//
// e1.printStackTrace();
// }
//
// System.out.println(new Date() + " begin march");
// long begintime = System.currentTimeMillis();
// Hit hit = null;
// int umCount = 0;
// int mCount = 0;
// for(String word : allWords){
// hit = Dictionary.matchInMainDict(word.toCharArray(), 0, word.length());
// if(hit.isUnmatch()){
// System.out.println(word);
// umCount++;
// }else{
// mCount++;
// }
// }
// System.out.println(new Date() + " finish march , cost " + (System.currentTimeMillis() - begintime ) + " millseconds");
// System.out.println("Match words : " + mCount + " Unmatch words : " + umCount);
// }
//
// /**
// * 量词排序
// */
// public void testSortCount(){
// InputStream is = DictionaryTester.class.getResourceAsStream(Dictionary.PATH_DIC_QUANTIFIER);
// TreeSet<String> allWords = new TreeSet<String>();
//
// try {
// String theWord;
// BufferedReader br = new BufferedReader(new InputStreamReader(is , "UTF-8"), 512);
// do {
// theWord = br.readLine();
// if (theWord != null) {
// allWords.add(theWord.trim());
// System.out.println(theWord.trim());
// }
// } while (theWord != null);
//
// } catch (IOException ioe) {
// ioe.printStackTrace();
//
// }finally{
// try {
// if(is != null){
// is.close();
// is = null;
// }
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
// }
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//}

View File

@ -1,97 +0,0 @@
///**
// *
// */
//
//import java.io.IOException;
//
//import org.apache.lucene.analysis.Analyzer;
//import org.apache.lucene.document.Document;
//import org.apache.lucene.document.Field;
//import org.apache.lucene.index.CorruptIndexException;
//import org.apache.lucene.index.IndexWriter;
//import org.apache.lucene.index.Term;
//import org.apache.lucene.search.IndexSearcher;
//import org.apache.lucene.search.Query;
//import org.apache.lucene.search.ScoreDoc;
//import org.apache.lucene.search.TopDocs;
//import org.apache.lucene.store.Directory;
//import org.apache.lucene.store.LockObtainFailedException;
//import org.apache.lucene.store.RAMDirectory;
//import org.wltea.analyzer.lucene.IKAnalyzer;
//import org.wltea.analyzer.lucene.IKQueryParser;
//import org.wltea.analyzer.lucene.IKSimilarity;
//
///**
// * @author linly
// *
// */
//public class IKAnalyzerDemo {
//
// public static void main(String[] args){
//
// String fieldName = "text";
//
// String text = "IK Analyzer是一个结合词典分词和文法分词的中文分词开源工具包。它使用了全新的正向迭代最细粒度切分算法。";
//
//
// Analyzer analyzer = new IKAnalyzer();
//
//
// Directory directory = null;
// IndexWriter iwriter = null;
// IndexSearcher isearcher = null;
// try {
//
// directory = new RAMDirectory();
// iwriter = new IndexWriter(directory, analyzer, true , IndexWriter.MaxFieldLength.LIMITED);
// Document doc = new Document();
// doc.add(new Field("ID", "1111", Field.Store.YES, Field.Index.NOT_ANALYZED));
// doc.add(new Field(fieldName, text, Field.Store.YES, Field.Index.ANALYZED));
// iwriter.addDocument(doc);
//
// iwriter.close();
//
//
// isearcher = new IndexSearcher(directory);
//
// isearcher.setSimilarity(new IKSimilarity());
//
// String keyword = "中文分词工具包";
//
//
// Query query = IKQueryParser.parse(fieldName, keyword);
//
//
// TopDocs topDocs = isearcher.search(query , 5);
// System.out.println("命中:" + topDocs.totalHits);
//
// ScoreDoc[] scoreDocs = topDocs.scoreDocs;
// for (int i = 0; i < topDocs.totalHits; i++){
// Document targetDoc = isearcher.doc(scoreDocs[i].doc);
// System.out.println("内容:" + targetDoc.toString());
// }
//
// } catch (CorruptIndexException e) {
// e.printStackTrace();
// } catch (LockObtainFailedException e) {
// e.printStackTrace();
// } catch (IOException e) {
// e.printStackTrace();
// } finally{
// if(isearcher != null){
// try {
// isearcher.close();
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
// if(directory != null){
// try {
// directory.close();
// } catch (IOException e) {
// e.printStackTrace();
// }
// }
// }
// }
//}

View File

@ -1,38 +0,0 @@
/**
*
*/
import org.apache.lucene.analysis.tokenattributes.TermAttribute;
import org.junit.Test;
import org.wltea.analyzer.lucene.IKTokenizer;
import java.io.IOException;
import java.io.StringReader;
/**
* @author 林良益
*
*/
public class IKTokenerTest {
@Test
public void testLucene3Tokenizer(){
String t = "IK分词器Lucene Analyzer接口实现类 民生银行";
IKTokenizer tokenizer = new IKTokenizer(new StringReader(t) , false);
try {
while(tokenizer.incrementToken()){
TermAttribute termAtt = tokenizer.getAttribute(TermAttribute.class);
System.out.println(termAtt);
}
} catch (IOException e) {
e.printStackTrace();
}
}
}

View File

@ -1,345 +0,0 @@
///**
// *
// */
//
//import org.apache.lucene.search.Query;
//import org.wltea.analyzer.IKSegmentation;
//import org.wltea.analyzer.Lexeme;
//import org.wltea.analyzer.lucene.IKQueryParser;
//
//import java.io.IOException;
//import java.io.StringReader;
//import java.util.ArrayList;
//import java.util.List;
//
///**
// * @author Administrator
// *
// */
//public class SegmentorTester{
//
// public void testLetter(){
// String t = "S43-LC10 AT&T and I.B.M Corp mail : 1.12.34.33 -1-2003%123*111-11+12 2009A17B10 10:10:23wo!r+d.1{}0.16-8AAAA_B$BB@0.1.12.34.33.10.18ok?hello001.txt";
//
//
//
//
//
//
//
//
//
//
// System.out.println(t);
// IKSegmentation ikSeg = new IKSegmentation(new StringReader(t) ,true);
// try {
// Lexeme l = null;
// while( (l = ikSeg.next()) != null){
// System.out.println(l);
// }
// } catch (IOException e) {
//
// e.printStackTrace();
// }
//
// }
//
//
// public void testNumberCount(){
// List<String> testStr = new ArrayList<String>();
// testStr.add("12.第");
// testStr.add("一九九五年12月31日,");
// testStr.add("1/++ ¥+400 ");
// testStr.add("-2e-12 xxxx1E++300/++");
// testStr.add("1500名常用的数量和人名的匹配 超过22万个");
// testStr.add("据路透社报道,印度尼西亚社会事务部一官员星期二(29日)表示,"
// + "日惹市附近当地时间27日晨5时53分发生的里氏6.2级地震已经造成至少5427人死亡"
// + "20000余人受伤近20万人无家可归。");
// testStr.add("古田县城关六一四路四百零五号");
// testStr.add("欢迎使用阿江统计2.01版");
// testStr.add("51千克五十一千克五万一千克两千克拉 五十一");
// testStr.add("十一点半下班十一点下班");
// testStr.add("福州第一中学福州一中福州第三十六中赐进士及第");
//
//
// for(String t : testStr){
// System.out.println(t);
// IKSegmentation ikSeg = new IKSegmentation(new StringReader(t) , true);
// try {
// Lexeme l = null;
// while( (l = ikSeg.next()) != null){
// System.out.println(l);
// }
// } catch (IOException e) {
//
// e.printStackTrace();
// }
// System.out.println("***************");
// }
//
// }
//
// public void testChinese(){
// List<String> testStr = new ArrayList<String>();
//
//
// testStr.add("据路透社报道,印度尼西亚社会事务部一官员星期二(29日)表示,"
// + "日惹市附近当地时间27日晨5时53分发生的里氏6.2级地震已经造成至少5427人死亡"
// + "20000余人受伤近20万人无家可归。");
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
// testStr.add("广州市越秀区广州大道中131-133号信龙大厦");
// for(String t : testStr){
// System.out.println(t);
// IKSegmentation ikSeg = new IKSegmentation(new StringReader(t) , false);
// try {
// Lexeme l = null;
// while( (l = ikSeg.next()) != null){
// System.out.println(l);
// }
// } catch (IOException e) {
//
// e.printStackTrace();
// }
// System.out.println("***************");
// }
//
// Character.UnicodeBlock ub = Character.UnicodeBlock.of('?');
// System.out.println(ub.toString());
//
//
//
//
//
// }
//
// public static void main(String[] args){
//
// String testString = "古籍网资料目录18详情请点击具体资料名称或返回首页编号名称复制费用155877渔家-宋寒衣-中国诗歌社40元155878海盗船-孙毓棠40元155887海燕的歌-" +
// "王亚平-联合出版社40元155888埃及人-王独清-世纪书局40元155889桃花底命运-王樵生-九一八书店40元155892菱塘崖-吴汶-中国诗社40元155894恋歌中国近代恋歌选-丁丁" +
// "-曹雪松-泰东图书局40元155895钢铁的手-新华书店40元155896民主诗歌-苏君夫-辽北书店48元155899露丝-谢康-北新书局40元155900翡冷翠的一夜-徐志摩-新月书店40元" +
// "155901受难者的短曲-杨骚-开明书店40元155902春的伤感-杨骚-开明书店40元155903夜行集-一凌40元155904种树集-衣萍-北新书局40元155905世纪的脸-" +
// "于赓虞-北新书局43元155906维梓诗选-于维梓-泰东图书局69元155907湖风-虞琰-现代书局40元155909动荡-藻雪-泰东图书局40元155910活体诗-张凤-群众图书公司94元155911西爪集" +
// "-张亚珠-中国影声社张坤贤40元155912张凤活体诗-张凤-群众图书公司94元155914马来情歌集-钟敬文-远东图书公司40元155915在星夜底下-邹绍文-新水文学社40元155917愿春天早点来" +
// "-艾青-诗艺社40元155918旷野-艾青-生活书店40元155922血的故事-陈汀-新新新闻40元155923憧憬集-程铮49元155925第二次世界大战纪事诗-方克刚-公益印刷公司40元155926冯玉祥先生抗" +
// "战诗歌集-华爱国-户图书社78元155927草原牧歌-戈茅-远方书店40元155928雷-光未然-北门出版社40元155930战士的歌-克锋-诗歌出版社40元155931睫-郎雪羽-飞花书室40元155932塞" +
// "上吟-林咏泉-文艺出版社40元155933出发-路易士-太平书局40元155934疾风-罗家伦40元155937晨夜诗度-彭丽天-闻一多40元155938后方小唱-任钧-上海杂志公司40元155940行知诗歌选" +
// "-陶行知-光华书店40元155943南中国的歌-童晴岚-诗歌出版社40元155945诗文学-魏荒努-诗文学社40元155946寒伧的歌-伍禾-文献出版社40元155948诗歌时代-许幸之-海石书店60" +
// "元155950向祖国-臧克家-三户图书社42元155953古树的花朵-臧克家-东方书社40元155954昆岑关-张泽厚-新三书店40元155955吹散的火星-郑思-耕耘出版社40元155956不时髦的歌-" +
// "祝实明-晨钟书局40元155959劳动英雄刘英源-侯唯动-光华书店40元155962午夜的诗祭-李岳南-知更出版社40元155963红色绿色的歌-炼虹-大地书局40元155965海内奇谈-马凡陀-东北" +
// "书店40元155966季节草-穆静-新生书局40元155969新世纪的呼声-孙滨47元155972大时代之梦-石兆棠-蕴山出版社40元155973江南解放史歌-田曲-教育书店40元155974饮马河之歌-夏葵" +
// "-大众印刷厂40元155975毛泽东同志-谢挺宇-大众书店40元155977走出了梦之谷-焰滔-海流出版社40元155979马凡陀的山歌续集-马凡陀-生活书店42元155981苦尽甜来-刘艺亭-东北书店40" +
// "元155982升平署曲本目录-国立北平图书馆中文编目组-中华华店40元155983百代剧词集-日本蓄音器商会大连支店-三光社印刷所93元155985曲选-顾名-大光书局118元155986元明曲选" +
// "-胡懒残-会文堂书局40元155988倩女离魂-孙席珍-亚细亚书局40元155989新生代的歌颂-路倜-青年出版社58元155990金元曲-卢前40元155993西厢-董解元-全民书局152元155995西厢记" +
// "-王君豪-时新书局52元156009燕山外史-大中书局-大中书局83元156010海天啸传奇-小说林总编译所-小说林总发行所40元156011牡丹亭-汤显祖-大达图书供应社63元156013燕子笺-阮大钺" +
// "-新文化书社99元156014长生殿-洪升-大达图书供应社50元156015病玉缘传奇68元156016当炉艳-薛恨生-新文化书社40元156017胭脂记-张仁寿-张仁寿律师事务所40元156019新编戏学汇考" +
// "-凌善清-许志豪-大东书局424元156030戏典-南腔北调人-中央书店744元156046粤东名优选本-丘鹤琴-大新书局40元156047歌曲大集会-丘鹤琴-大新书局40元156048大戏考索引-邵子潘-" +
// "大兴无线电唱机行41元156050平剧戏考-叶少群-戏剧出版社164元156054戏考013册-中华图书馆编辑部-中华图书馆162元156055戏考017册-中华图书馆编辑部-中华图书馆156元156056戏考" +
// "025册-中华图书馆编辑部-中华图书馆152元156057戏考029册-中体裁图书馆编辑部-中华图书馆150元156058戏考033册-中华图书馆编辑部-中华图书馆156元156059戏考037册-中华图书" +
// "馆编辑部-中华图书馆159元156060黄巢-陈其通-大众书店40元156061闯王进京-马少波-大众书店40元156063廉颇蔺相如-陈德明-东北书店40元156064得意缘-林如松-晓星书店40元156065" +
// "全部连环套-卢继影-好运道书局40元156066戏迷传-吕月樵-共和图书馆40元156067麒麟童-卢继影-好运道书局40元156068木兰从军-缀玉轩-香港同乐会40元156072乌龙院-卢继影-" +
// "好运道书局40元156074胭脂宝褶-马连良-罗汉出版社40元156075夜审潘洪-卢继影-罗汉出版社40元156076离燕哀-尹仲锡-新民印书馆51元156081蹦蹦戏考-评剧研究社-评剧研究社40" +
// "元156083逼上梁山-延安平剧研究会-新华书店40元156085千古恨-周文-王修-东北书店40元156089绍兴文戏全部玉堂春-越伶书社40元156090川剧选粹40元156091蜀剧苑-冉炯叔-蜀剧" +
// "苑出版社40元156092广东大戏考-冯清平-播音界联谊社96元156093抗战潮剧集-赖德风-正言印刷所40元156094盼八路-力鸣-孙康-东北书店40元156096担水前后-东北书店-东北书店40元" +
// "156097挖穷根-关守耀-胡玉亭-东北书店40元156098赵河山转变-韩北生-杜希唐-马毅-杨栋林-王礼易-新华书店40元156100春耕互助-力鸣-东北书店40元156101信不得-刘相如-东北书店" +
// "40元156103永安屯翻身-鲁艺文工团-东北书店48元156104买不动-鲁亚农-东北书店40元156105谁沾光-侣朋-东北书店40元156106蒸干粮-太行行署教育处文联-太行群众书店40元156107" +
// "夜探阎王殿-王越-东北书店40元156109归队-鲁虹-萧丁-东北书店40元156110群众创作选集-江帆-东北书店55元156111戏剧与歌曲-沈阳市文联筹委会-沈阳市文联筹委会40元156115洪波曲-" +
// "安娥-任光-育文出版社40元156116鞋-白辛-东北书店40元156120人民城市-陈戈-东北书店40元156121一个裁缝之死-地子-马瑜-东北书店40元156122好班长-丁洪・唐克-东北书店40元156123" +
// "三担水-丁洪-东北书店40元156129眼睛亮了-何迟-东北书店40元156130白毛女-贺敬之-丁毅-东北书店49元156131白毛女-延安鲁艺-吉林书店48元156132白毛女-延安鲁艺工作团-新华书" +
// "店50元156133复仇-胡零-新华书店66元156134火-胡零-东北书店41元156135周喜生作风转变-皇甫束玉-新华书店40元156136神兵-买霁-东北书店40元156138废铁炼成钢-蓝澄-东北书" +
// "店40元156154反民逼官-钟纪明-黄俊耀-王志新-李微含-东北书店40元156155为谁打天下-东北军政大学宣传队-东北书店40元156157现代名剧精华-魏如晦-潮锋出版社65元156160救亡戏剧" +
// "-陈文杰-2005-10-战时读物编译社40元156161裂痕-独幕剧创作月刊社-剧艺出版社44元156162抗战戏曲集-郭莽西-正中书局52元156163墙头草-晋察冀边区戏剧协会-东北书店40元156175" +
// "解放区农村剧团创作选集-方徨-东北书店40元156179国耻短剧-中国书局40元156180话剧两种-雅<>-东吴大学40元156183独幕剧新集-朱雷-光明书局63元156186洪深剧本创作集-洪深-" +
// "东南书局49元156190战斗-章泯-生活书店54元156193洪宣娇-魏如晦-民国书店40元156196大渡河-陈白尘-光艺印刷厂56元156197苏武-顾一樵40元156198白娘娘-顾一樵40元156202" +
// "三个叛逆的女性-郭沫若-光华书局68元156205九宫山一个农民战争失败的历史的悲剧-擎戢词人-新华书店40元156206正气-罗永培40元156207忠王李秀成-欧阳予倩-文化供应社62" +
// "元156208复国-孙家<E5AD99>42元156210红心草-王梦鸥-独立出版社40元156211傀儡皇帝-王维克-世界书局40元156213赛金花-夏衍-生活书店40元156214赛金花-熊佛西-实报社40元156215" +
// "天国春秋-阳翰笙-群益出版社60元156218秦良玉-杨村彬-中央青年剧社40元156221大家办合作-常功-胡正-孙千-东北书店40元156225亡蜀遗恨-周贻白-潮锋出版社40元156226木兰从军-" +
// "左斡臣-启智书局40元156228民族正气-赵循伯40元156232铁砂-胡绍轩-独立出版社42元156233野马-寇嘉弼-三人出版社42元156235一个战士-沙丹-东北书店40元156241断鸿零雁-黄嘉谟-" +
// "第一线书店40元156242红玫瑰-李鸿梁-梁溪图书馆40元156244不忠实的爱-向培良-启明书局50元156326闻鸡起舞-王世经-笔花出版社40元156327乱世佳人-王光鼐-民族出版社60元156328" +
// "天花乱坠-王勉之-国民图书出版社48元156330为自由和平而战-王为一-生活书店40元156331凤凰城-吴祖光-生活书店54元156332烟苇港-洗群-六艺书店40元156336草木皆兵-夏衍-宋之的-于" +
// "伶-美学出版社40元156337都会的一角-夏衍-激流书店40元156423扑灭倭寇-张择厚-跋涉书店40元156424全家忙-边区群众剧社-新华书店40元156425街头剧创作集-光未然-扬子江出版社4" +
// "0元156250巨弹-傅克兴-长风书店40元156252海牙剖腹记炸皇宫40元156255五奎桥-洪深-复兴书局40元156256复活的国魂-侯曜40元156260死的胜利-刘大杰-启智书局40元156261白蔷薇-" +
// "刘大杰-东南书店40元156262阿Q正传-鲁迅-光明书局40元156265回春之曲-田汉-普通书店56元156266革命的前夜-王志之-大众书局46元156267亚细亚的怒潮-王绍清-金汤书店42元156269" +
// "他的天使-杨骚50元156270迷雏-杨骚-北新书局40元156272两个角色演底戏-袁牧之40元156273信号-张白衣-中外书店64元156275不夜城-阿英-潮锋出版社40元156277费娜小姐-巴人-" +
// "海燕书店41元156287黄鹤楼-陈铨40元156289岁寒图-陈白麈-群益出版社53元156292同胞姐妹-顾仲彝-世界书局40元156294把眼光放远点-胡丹沸-大众书店40元156297国家至上-老舍-" +
// "新丰出版公司40元156299归去来兮-老舍-作家书屋42元156300顺民-王震之-崔嵬-生活书店40元156304云彩霞-李健吾-寰星图书杂志社40元156305梅红时节-李丽水-滨湖出版社40元156306" +
// "遥望-李庆华-天地出版社40元156307乐园进行曲-凌鹤-大东书局53元156309在敌人后方-罗丹-东北书店40元156313旧关之战-宋之的-生活书店40元156315敌忾同仇-苏凡-中外出版社40元156317" +
// "芦沟桥-绍轩52元156322中国万岁-唐纳-大公报40元156323芦沟桥-田汉-线香街四十号40元156338离离草-夏衍-新华书店40元156342密支那风云-徐昌霖-大陆图书杂志出版公司40元156343" +
// "重庆屋檐下-徐昌霖-大陆图书杂志出版公司55元156349同志你走错了路-姚仲明-陈波儿-光华书店46元156351火中莲-姚苏凤-万象周刊社40元156352恋爱问题-易乔-剧艺出版社40元156354女儿国" +
// "-于伶-国民书店71元156355长夜行-于伶-远方书店45元156356放下你的鞭子-张国威-战时读物编译社40元156359家破人亡-章泯-新演剧社40元156362自由魂-赵慧深-上海杂志公司40元156363" +
// "此恨绵绵-赵清阁-新中华文艺社40元156364广源轮-郑倚虹-读书出版社40元156368火烛小心-包蕾-华华书店40元156371窑工-丁玲-陈明-逯斐-大众书店40元156372部队剧选-东北民主联军总政治部" +
// "-东北民主联军总政治部58元156375鸡鸣早看天-洪深-华中图书公司46元156376指挥员在哪里-黄钢-新华书店40元156377炼狱-晋驼-光华书店40元156379刘桂兰捉奸-蓝澄-新华书店40元156380阵地" +
// "-黎阳-东北书店40元156383血债-李之华-侣明-大众书店40元156384反翻把斗争-李之华-东北书店40元156387牢笼计-侣朋-东北书店40元156388柜中人-马瑜-地子-西虹-东北书店40元156389" +
// "谁劳动是谁的-沙丹-宁玉珍-李牧-东北书店40元156390春常在-沈蔚德53元156391翻天覆地的人-闻捷-新华书店40元156392河山春晓-吴铁翼-文信书局42元156393天下无敌-军大宣传队集体创作-" +
// "新华书店40元156399春到人间-张英-戏剧文学出版社40元156403炮弹是怎样造成的-陈其通-新华书店40元156405云雀-路翎-希望社40元156406阿Q剧本-陈梦韶-华通书局40元156408寄生虫-洪深-" +
// "上海杂志公司40元156409飘- 美 M.Mi hell-柯灵-美学出版社63元156410英雄儿女-莱逊-李束丝-群益出版社40元156414水落石出-梅特林-王石城40元156416怒吼吧中国-周雨人-剧艺社40元" +
// "156417人兽之间-包起权-独立出版社40元156418蠢-徐渠-文国社40元156419还我故乡-史东山-明华书店40元156428恨相逢-曹乃文-北京文化服务社40元156429唐人传奇选-文艺小丛书社40元156433" +
// "马振华哀史-马振华-群友社40元156434马振华哀史-张碧梧-华合出版社40元156436小青之分析-潘光旦-新月书店40元156437国民革命军北伐演义-陶凤子-民众书局330元156445中国暗杀案-陶啸秋-" +
// "交通图书馆52元156446照妖镜-郁道庵-格言丛辑社65元156448中国侦探谭男女三十六党秘史-陈啸秋-世界书局40元156449瀛海逸闻-长宁沈宗元-昌福公司50元156450兰娘哀史-吴双热君-" +
// "民权出版部40元156459李师师全史-陈连痕-竞智图书馆40元156460赛金花遗事-杜君谋-大方印务局40元156462红蝴蝶-汪景星-广益书局65元156464盗陵案-胤子-平化合作社69元156469" +
// "中国黑暮大观70元156473富人之女-包天笑-自由杂志社40元156474破涕录-李警众-民权出版部40元156475世说新语-刘义庆-大中书局40元157146鸭绿江上-蒋光赤-亚东图书馆60元157147" +
// "钱如海-今睿40元157148海的渴慕者-<2D>工-民智书局64元157150海滨之人-庐隐66元157160爱之冲突-王衡-北新书局50元157163沉沦-郁达夫-泰东图书局52元157167烦恼的网-周全平-泰东图书局" +
// "40元157171春天里的秋天-巴金-开明书店40元157173电-巴金-东方书店40元157177抹布-巴金-星云堂书店40元157180雪-巴金-平社出版社57元157181幽灵-巴金-艺光书店40元157182" +
// "脱了牢狱的新囚-白鸥女士-湖风书局44元157186往事-冰心-开明书店40元157188漩涡-陈白尘-金屋书店49元157190归来-陈白尘40元157191黄昏-陈霭麓-世界书局42元157193如梦-学昭-" +
// "真美善书店40元157195小雨点-陈衡哲-新月书店42元157201爱网-楚洪-北新书局66元157202前夜-戴万叶-亚东图书馆56元157203黄昏-丁文73元157205在黑暗中-丁玲-开明书店68元157210" +
// "创痕-左斡臣-亚细亚书局40元157211火殉-左斡臣-文艺书局40元157213青春-张资平-现代书局40元157214存亡与血泪-赵吟秋-国民图书馆48元157215殊兵-周全平-现代书局43元157217" +
// "文言对照短篇小说-庄衣言-民智书局40元157218圣处女的被污-樊心华-光华书局40元157219斋东新语-范烟桥-文新印刷公司40元157221怅惘-冯都良-光华书局40元157223少年先锋-高沐鸿-" +
// "震东印书馆76元157225爱的病狂者-顾仲起-现代书局40元157226生活的血迹-顾仲起-现代书局54元157227笑与死-顾仲起-泰东图书局40元157228广雅的一日-广雅中学学生自治会“广雅的一日”" +
// "编委会-红轮印务铸字局71元157229巫山奇遇-广野居士-中央书店40元157230郭沫若文选-郭沫若-时代出版社54元157231一只手-郭沫若-世纪书局40元157232织露丝姑娘-郭兰馨-卿云书局40元" +
// "157234黑猫-郭沫若-现代书局40元157239水平线下-郭沫若-现代书局51元157242桂公塘-郭源新56元157243少女之春-郭箴一-郭箴一40元157245点缀-荷拂-南华图书局40元157248做父亲去-" +
// "洪为法-金屋书店40元157249红花-芳草书店40元157250流亡-洪灵菲-现代书局64元157252四星期-胡也频-华通书局40元157256酒家-蹇先艾-新中国书局56元157259夜话-蒋光慈-生活社40元" +
// "157261胜利的微笑-蒋光慈-光华书店48元157264异邦与故国-蒋光慈-现代书局40元157265最后的微笑-蒋光总48元157267野祭-蒋光慈-现代书局40元157271花柳病春-金满城-现代书局42元157272" +
// "爱的谜-金石声-启智书局40元157274神秘之路-菊神女士-广益书局40元157275缺陷的生命-克农-启智书局57元157294中学时代-着@林疑今-曾献声-神州国光社40元157295瞬息京华-林语堂-" +
// "正气书局41元157296明朝-林曼青-亚东图书馆49元157298旗声-林疑今-现代书局61元157371雪夜-汪敬熙-亚东图书馆40元157373结局-汪锡鹏-创造社49元157374幽愤-王谷君-启智书局40元" +
// "157375现代作家-王坟-真美善书店42元157377何似-王警涛-新民图书馆兄弟公司40元157378爱之苦痛-王警涛-新民图书馆兄弟公司40元157379捉鬼篇-王任叔-上海印书馆53元157380刘大姑娘-" +
// "王澍-联合书店40元157382惜分飞-王余杞-春潮书局44元157383王以仁的幻灭-王以仁-新文出版社140元158051山寺暮-严文井-现代散文新集:良友图书印刷公司45元158053周郎集-张怜新40元" +
// "158139三万六千里旅途随笔-欧阳川-黎萍-萧群-周逸章-中国图书编译馆62元157299珊瑚集-凌善-大东书局65元157300花之寺-凌叔华-新月书店48元157303菩提珠-柳元非忌垢-北新书局40元" +
// "157304烟盒-柳风-海音书局40元157305海滨故人-卢隐66元157306阿串姐-卢梦殊-真美善书店62元157308童年的悲哀-鲁彦-亚东图书馆46元157309杜鹃啼倦柳花飞-鲁觉吾-建国月刊社45元" +
// "157310悲哀的心灵-鲁航泰-华普书局40元157311屋顶下-鲁彦51元157312天真底文艺-陆天-老德和昶87元157322莲蓉月-罗西-现代书局40元157323竹尺和铁锤-罗西-正午书局43元157324" +
// "谣言的来源-吕伯攸-世界书局40元157325棘心-绿漪-北新书局86元157326虹-矛盾-开明书店70元157327林家铺子-茅盾-东北书店40元157333三人行-茅盾-开明书店40元157334没有果酱的面包" +
// "-正中书局40元157337稚莹-凫公99元157339祝福-裴庆余-文化出版社40元157340茶杯里的风波-彭家煌-现代书局44元157341平淡的事-彭家煌-大东书局40元157343涛语-评梅女士-神州国光社" +
// "60元157345盐场-铁台生-生光出版部40元157347玉兰花下-壬秋-盛京书店40元157348二月-柔石-春潮书局66元157351雅典娜-时间有恒-卿云图书公司40元157352没有祖国的孩子-舒群-生活书店" +
// "60元157353凤仙姑娘-孙席珍-现代书局40元157354到大连去及其他-孙席珍-春潮书局40元157356三别-苕狂-世界书局40元157358夜阑-沉樱女士-光华书局40元157360春灯集-沈从文-开明书店" +
// "46元157361旧梦-沈从文54元157364一个天才的通信-沈从文-光华书局40元157365旅桂蒙难记-释悦西-民生印刷所46元157367上元镫-施蛰存-新中国书局45元157370睡莲-滕固-芳草书店40元" +
// "157386甜梦中的风波-韦月侣-南星书店40元157387生之细流-闻国新-北平文化学社46元157390十五年代-向培良-支那书店54元157391跋涉-三郎-悄吟-五画印刷社54元157395八月的乡村-萧军-" +
// "作家书屋73元157396八月的乡村-萧军60元157399第三代-萧军46元157400幻醉及其他-徐志摩-谢冰季-中华书局57元157402古国的人们-徐霞村-水沫书店40元157404奔波-徐蔚南-北新书局" +
// "40元157405不识面的情人-徐雉-新文化书社40元157407亚拉伯的骆驼-许跻青-新宇宙书店40元157408暮春-许杰-大光书局40元157409一坛酒-许钦文-北新书局58元157410泪吻-许跻青-北新书局" +
// "44元157411安慰-严良才-光华书局40元157412哭与笑-杨荫深-现代书局40元157414狂澜-杨村人-泰东图书局43元157415失踪-杨村人-亚东图书馆40元157417白痴-叶鼎洛-真善美书店47元157418" +
// "灵凤小说集-叶灵凤-现代书局119元157419双影-叶鼎洛-现代书局40元157422红的天使-叶灵凤-现代书局43元157424倪焕之-叶绍钧-开明书店111元157427城中-叶绍钧-开明书店41元157428" +
// "友情-章衣萍-北新书局54元157429鸠绿媚-叶灵凤-光华书局40元157430文状元-殷作桢-大光书局64元157431晚霞-余慕陶-启智书局40元157433喜轿-俞长源-真美善书店46元157437急湍-隅<>" +
// "100元157443都会交乡曲-张若谷-真美善书店40元157444泪-左干臣-泰东图书局48元157445傀儡-张静岚-朔风月刊社40元157446儒林新史―婆汉迷-张若谷-益华书局52元157447鬼影-张少峰-" +
// "震东印书馆64元157449小彼得-张天翼-复兴书局56元157450脱了轨道的星球-张资平-现代书局52元157451明珠与黑炭-张贺平-光明书局84元157452柘榴花-张资平-光明书局41元157453植树节" +
// "-张资平-新宇宙书店48元157454苦瓜集-赵小松-艺文书房62元157458失败者-郑震-启智书局44元157459椰子集-郑吐飞-真美善书店52元157460孤坟-志行-亚东图书馆63元157461定慧方丈-" +
// "周乐山-南京书店40元157463炼狱-周楞伽-微波出版社158元157466动乱一年-朱雯-33书店78元157468紫洞艇-祝秀侠-亚东图书馆55元157472夫与妻-巴金-文化出版社60元157473火-巴金-" +
// "开明书店225元157476死去的太阳-巴金-开明书店40元157478今-巴林-中国图书杂志公司40元157479奔赴祖国-白尔-独立出版社51元157481风砂之恋-碧野-群益出版社73元157483幸福-仓夷-" +
// "东北书店40元157484入伍-慈灯-中华图书馆93元157485从风吹来的地方-仇重-中国儿童时报社40元157489搏斗-陈明章-真实书店40元157490春雷-陈瘦竹-华中图书公司117元157491地下-" +
// "程造之-海燕书店97元157494东村事件-丁玲40元157497江南风景-端木蕻良-时代书局40元157500新都花絮-端木蕻良-知识出版社52元157502热情的伴侣-房慕梁-欧亚出版社40元157504山水-" +
// "冯至-国民图书出版社40元157505隐刑-凫公-京津出版社48元157507离乡集-戈壁-新民印书馆46元157508黄河边上的春天-戈金-晓峰出版社69元157512我的父亲-顾一樵-新月书店40元157513" +
// "海-关菁英-关东出版社51元157514烽烟万里-郭根-好华图书公司40元157516战斗中的一年-何家槐-民众书店40元157517寒夜集-何家槐-复兴书局64元157519恋?<3F><>?-胡寄尘-广益书局40" +
// "元157523雷声-黄贤俊-新群出版社57元157529迷惘-敬乐然-益智书店40元157532火车集-老舍-上海杂志公司66元157536离婚-老舍-北京大学60元157538贫血集-老舍-文聿出版社40元157545" +
// "爬山虎-李韵如-文周出版社40元157547八人集-林微音-诗领土社40元157550地雷-柳青-光华书店40元157554腐草-鲁莽-中国文化服务社40元157555论阿Q正传-路沙-草原书店44元157559春王正月" +
// "-罗洪女士-良友图书印刷公司59元157560兰色的图门江-骆宾基-新丰出版公司40元157561黑丽拉-侣伦63元157563露露-马国亮-良友图书公司40元157564飞鹰旗-马子华-读书生活出版社40元157566" +
// "腐蚀-茅盾-大众书店54元157567第一阶段的故事-茅盾-文光书店68元157569阿黄-薄玉珍-梅晋良-基督教联合出版社40元157570南北极-穆时英-复兴书局44元157571南北极-穆时英-自力出版社" +
// "44元157574给予者-欧阳山-读书生活出版社40元157575战果-欧阳山-学艺出版社64元157576新生代-齐同-生活书店104元157578旧仇新憾-卿秉渊-国魂书店40元157579网-石木-中央书报65元" +
// "157583人的希望-司马文森66元";
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
//
// System.out.println("Length = " + testString.length());
// IKSegmentation ikSeg = new IKSegmentation(new StringReader(testString) , false);
//
// try {
// Thread.sleep(5000);
// } catch (InterruptedException e1) {
//
// e1.printStackTrace();
// }
//
// long begin = System.currentTimeMillis();
// try {
//
//
//
//
// while( ikSeg.next()!= null);
//
// } catch (IOException e) {
//
// e.printStackTrace();
// }
// long end = System.currentTimeMillis();
// System.out.println("耗时 : " + (end - begin) + "ms");
//
// System.out.println("***************");
//
// }
//
// public void testQueryParser(){
// Query query = null;
// try {
//
//
// query = IKQueryParser.parse("F", "多少倍");
// } catch (IOException e) {
//
// e.printStackTrace();
// }
// System.out.println(query);
// }
//
//}

View File

@ -1,11 +0,0 @@
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典-->
<entry key="ext_dict">/mydict.dic;</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">/ext_stopword.dic</entry>
</properties>

View File

@ -1,530 +0,0 @@
也
使
更好的
选择
哎呀
哎哟
俺们
按照
吧哒
罢了
本着
比方
比如
鄙人
彼此
别的
别说
并且
不比
不成
不单
不但
不独
不管
不光
不过
不仅
不拘
不论
不怕
不然
不如
不特
不惟
不问
不只
朝着
趁着
除此之外
除非
除了
此间
此外
从而
但是
当着
的话
等等
叮咚
对于
多少
而况
而且
而是
而外
而言
而已
尔后
反过来
反过来说
反之
非但
非徒
否则
嘎登
各个
各位
各种
各自
根据
故此
固然
关于
果然
果真
哈哈
何处
何况
何时
哼唷
呼哧
还是
还有
换句话说
换言之
或是
或者
极了
及其
及至
即便
即或
即令
即若
即使
几时
既然
既是
继而
加之
假如
假若
假使
鉴于
较之
接着
结果
紧接着
进而
尽管
经过
就是
就是说
具体地说
具体说来
开始
开外
可见
可是
可以
况且
来着
例如
连同
两者
另外
另一方面
慢说
漫说
每当
莫若
某个
某些
哪边
哪儿
哪个
哪里
哪年
哪怕
哪天
哪些
哪样
那边
那儿
那个
那会儿
那里
那么
那么些
那么样
那时
那些
那样
乃至
你们
宁可
宁肯
宁愿
啪达
旁人
凭借
其次
其二
其他
其它
其一
其余
其中
起见
起见
岂但
恰恰相反
前后
前者
然而
然后
然则
人家
任何
任凭
如此
如果
如何
如其
如若
如上所述
若非
若是
上下
尚且
设若
设使
甚而
甚么
甚至
省得
时候
什么
什么样
使得
是的
首先
谁知
顺着
似的
虽然
虽说
虽则
随着
所以
他们
他人
它们
她们
倘或
倘然
倘若
倘使
通过
同时
万一
为何
为了
为什么
为着
嗡嗡
我们
呜呼
乌乎
无论
无宁
毋宁
相对而言
向着
沿
沿着
要不
要不然
要不是
要么
要是
也罢
也好
一般
一旦
一方面
一来
一切
一样
一则
依照
以便
以及
以免
以至
以至于
以致
抑或
因此
因而
因为
由此可见
由于
有的
有关
有些
于是
于是乎
与此同时
与否
与其
越是
云云
再说
再者
在下
咱们
怎么
怎么办
怎么样
怎样
照着
这边
这儿
这个
这会儿
这就是说
这里
这么
这么点儿
这么些
这么样
这时
这些
这样
正如
之类
之所以
之一
只是
只限
只要
只有
至于
诸位
着呢
自从
自个儿
自各儿
自己
自家
自身
综上所述
总的来看
总的来说
总的说来
总而言之
总之
纵令
纵然
纵使
遵照
作为
喔唷

File diff suppressed because it is too large Load Diff

View File

@ -1,25 +0,0 @@
使

View File

@ -1,312 +0,0 @@
世纪
位数
像素
克拉
公亩
公克
公分
公升
公尺
公担
公斤
公里
公顷
分钟
加仑
千克
千米
周年
小时
平方
平方公尺
平方公里
平方分米
平方厘米
平方码
平方米
平方英寸
平方英尺
平方英里
平米
年代
年级
月份
海里
点钟
盎司
秒钟
立方公尺
立方分米
立方厘米
立方码
立方米
立方英寸
立方英尺
英亩
英寸
英尺
英里
阶段

View File

@ -1,33 +0,0 @@
a
an
and
are
as
at
be
but
by
for
if
in
into
is
it
no
not
of
on
or
such
that
the
their
then
there
these
they
this
to
was
will
with

View File

@ -1,37 +0,0 @@
斯基
维奇
诺夫

View File

@ -1,131 +0,0 @@
丁
万俟
上官
东方
令狐
仲孙
公冶
公孙
公羊
单于
司徒
司空
司马
夏侯
太叔
宇文
宗政
尉迟
慕容
欧阳
淳于
澹台
濮阳
申屠
皇甫
诸葛
赫连
轩辕
钟离
长孙
闻人
闾丘
鲜于