1. 首页
  2. 编程语言
  3. Java
  4. Stemmer波特词干算法

Stemmer波特词干算法

上传者: 2019-08-01 03:44:56上传 JAVA文件 13.27KB 热度 26次
在英语中,一个单词常常是另一个单词的“变种”,如:happy=>happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。应用最为广泛的、中等复杂程度的、基于后缀剥离的词干提取算法是波特词干算法,也叫波特词干器(PorterStemmer)。详见官方网站。比较热门的检索系统包括Lucene、Whoosh等中的词干过滤器就是采用的波特词干算法。
下载地址
用户评论
码姐姐匿名网友 2019-08-01 03:44:56

效果还不错,值得借鉴

码姐姐匿名网友 2019-08-01 03:44:56

准确度一般,但是可以用来参考

码姐姐匿名网友 2019-08-01 03:44:56

波特算法,效果还好

码姐姐匿名网友 2019-08-01 03:44:56

效果还可以,不过距离理想的差些

码姐姐匿名网友 2019-08-01 03:44:56

波特算法,效果还好吧

码姐姐匿名网友 2019-08-01 03:44:56

非常好用哦

码姐姐匿名网友 2019-08-01 03:44:56

项目中正好要用到,帮了大忙了。

码姐姐匿名网友 2019-08-01 03:44:56

这就是正常的stemmer算法,本来效果就一般般 同意

码姐姐匿名网友 2019-08-01 03:44:56

这就是正常的stemmer算法,本来效果就一般般