Elasticsearch-analysis-HanLP 8.18.0中文分词插件
中文搜索优化的首选之一就是Elasticsearch-analysis-hanlp-8.18.0插件,直接把HanLP接进Elasticsearch里,分词、词性标注一把抓。安装后,Elasticsearch 就能中文内容,像电商搜索、内容管理系统这些,效果一下就上来了。
HanLP 的中文分词功能挺稳的,长文本也不含糊,效率和准确率都在线。你要是做中文搜索或者自然语言相关的项目,用它真省事,中文分词不用自己造轮子了。
analysis-hanlp
的版本号是8.18.0
,对应的就是Elasticsearch 8.18.0。只要版本对上,装起来基本没坑。插件支持自定义词典和分词模式,调调参数就能贴合你具体业务的需求。
你看,比如做商品搜索的,直接用它做词切分,关键词提取也有了,响应也快。论坛内容检索、新闻聚合这些场景,也一样适用。中文文本量大又杂,它起来还挺稳,基本不会掉链子。
插件压缩包名就叫analysis-hanlp
,估计里面就包含了安装和配置文件,搞起来也不复杂,按文档一步步来就行。
如果你用的是 Elasticsearch,又正好要中文数据,这个插件别错过了。装完之后能让你的搜索体验提升。HanLP也可以看看,顺便熟悉下它的 NLP 能力。
下载地址
用户评论