Elasticsearch-Analysis-HanLP 8.17.4中文分词插件
中文搜索的痛点,基本都能靠elasticsearch-analysis-hanlp-8.17.4。它是基于HanLP的中文分词插件,专门给Elasticsearch用的,中文效果真心不错,分词细、识别准,尤其适合内容站、搜索服务之类的场景。
分词插件里常见的IK、jieba,其实都用过,但你要是追求更智能、更语义的分词,HanLP真的值得一试。比如“苹果手机壳”不会被乱切成“苹果”“手机”,而是识别成一个实体,这点对提升搜索准确率太关键了。
安装方式也挺直白,直接把插件装进Elasticsearch就行,一般放到plugins
目录,重启服务就能用了。配合 mapping 里设置hanlp
器,快就能跑起来。
而且,这个版本是8.17.4,兼容 Elasticsearch 8 系,适配性没问题。如果你是做中文搜索或文本的,早点上这个插件,省时省心。
还有个小建议:如果你对中文文本的需求比较复杂,比如要做词性标注、实体识别等,不妨深挖下HanLP的进阶功能,说不定能省掉一堆后的麻烦。
感兴趣的可以看看这些相关资料:
,如果你正好在用Elasticsearch,又对中文搜索精度有要求,这插件值得试试。用得好,甚至能帮你提升一整个搜索系统的体验。
下载地址
用户评论