lucene中文分词公用组件V1.2
在IKAnalyzer1.1基础上,更新词典,优化对人名和公司名切分的!IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的正反向全切分以及正反向最大匹配切分两种算法,是LuceneAnalyzer接口的实现,代码使用例子如下:正反向全切分算法:实现类:org.mira.lucene.analysis.IK_CAnalyzer分词效果测试,命令行如下:java-classpathIKAnalyzer.jar;lucene-core-2.0.0.jarorg.mira.lucene.analysis.IK_CAnalyzer中华人民共和国香港特别行政区java代码
用户评论
可以使用,不错
正在尝试使用,还不太了解
毕业设计做的分词,下载下来参考一下。
挺好的,说明也很详细,中文分词的效果还是可以的,至少实现了中文分词
挺好的,说明也很详细
中文分词的效果还是可以的,至少实现了中文分词
这个是lucene3版本以下适用
还行,注释全面
不错 注释全面 非常适合新手 我找了好久了
恩 試過了 可以使用 ,但是似乎和斯坦福分詞相比差距不小