Elasticsearch-Analysis-IK 9.0.1中文分词插件
Elasticsearch 的中文一直是个麻烦事,用 IK 分词插件就能轻松搞定。elasticsearch-analysis-ik-9.0.1是配套 Elasticsearch 9.0.1 的中文分词利器,支持自定义词库,分词粒度也比较灵活,想切细就细,想扫一下也能满足。里面的ik-core-1.0.jar
就是核心模块,关键功能都靠它撑着。
包里还带了httpclient
、commons-codec
这些依赖,挺贴心的,省得你自己去下。还有plugin-descriptor.properties
这类元数据文件,用来让 Elasticsearch 认这个插件的“户口”。说白了,只要把整个包解压丢到plugins
目录里,重启一下,IK 就能跑起来了,挺省事。
分词效果方面,IK 支持细粒度和智能分词两种模式,比如“中华人民共和国”,细粒度会切成“中华”、“人民”、“共和国”,智能模式直接识别成一个词组,这对搜索精度提升还挺的。而且你还能通过config
目录里放词库文件,自定义词语,实用。
如果你项目面向中文内容比较多,或者你发现默认的 Elasticsearch 搜索出来总有点“搭不上话”,那装个elasticsearch-analysis-ik-9.0.1
会是个不错的选择。兼容性强,安装也不折腾,是我用下来比较稳定的分词插件了。
对了,顺手附几个相关资源,像IK 分词、ElasticSearch 使用的 ik 中文分词包这几个,也可以看看,有些会带词库或案例代码,能帮你快速上手。
下载地址
用户评论