1. 首页
  2. 编程语言
  3. 其他
  4. Lucene中文分词器包

Lucene中文分词器包

上传者: 2019-09-18 02:13:16上传 JAR文件 853.21KB 热度 51次
来自“猎图网www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器。1.正向全切分算法,42万汉字字符/每秒的处理能力(IBMThinkPad酷睿I1.6G1G内存WinXP)2.对数量词、地名、路名的优化处理3.对未知词汇采用自识别结合二元切分算法,确保搜索召回率(使用方法请参考IKAnalyzerV1.1版)
下载地址
用户评论
码姐姐匿名网友 2019-09-18 02:13:16

不错 回顾一下Lucene

码姐姐匿名网友 2019-09-18 02:13:16

还没装好,不知效果如何

码姐姐匿名网友 2019-09-18 02:13:16

版本相对比较老,不过作为分词初步学习还是可以

码姐姐匿名网友 2019-09-18 02:13:16

一般般 还是不能支持中英文混合

码姐姐匿名网友 2019-09-18 02:13:16

版本有点老啊

码姐姐匿名网友 2019-09-18 02:13:16

学自然语言的真的很不容易啊 楼主加油 资源肯定很好

码姐姐匿名网友 2019-09-18 02:13:16

已经很旧了

码姐姐匿名网友 2019-09-18 02:13:16

留着备用,虽然很旧了