Elasticsearch-Analysis-STConvert 8.17.5中文分词插件
中文分词的利器,elasticsearch-analysis-stconvert-8.17.5插件真挺实用。对接了 STConvert 分词器,适配了 ES 8.x,用起来顺手又高效,适合需要精准中文搜索的场景。你要是经常中文文本,装上它,检索效果能立马拉满。
STConvert 的核心逻辑封装在stconvert-core-1.0.jar
里,搭配主插件elasticsearch-analysis-stconvert-8.17.5.jar
一起扔进plugins
目录,启动 Elasticsearch 就能自动加载,基本没啥配置门槛。
它支持多种中文分词策略,比如正向最大匹配、逆向最大匹配、双向匹配这些常见算法,对中文来说还是蛮重要的。是在中文搜索、关键词提取、文本挖掘这些场景里,用它来做,分词更准确,响应也快。
插件本身也比较轻巧,结构简单清晰,还有plugin-descriptor.properties
负责信息。开发者想改点啥或者加点自定义功能也方便。你要是习惯折腾,可以试着改词库或扩展分词逻辑,灵活性不错。
如果你以前用过IKAnalyzer
或结巴分词
,这款插件其实风格类似,但在中文语义上会更精准些,是对专业词库的支持也挺到位。有需要的可以顺手对比一下:
哦对了,如果你还在用 ES 老版本,可以先确认下兼容性,8.17.5对 ES 8.x 系列的支持是没问题的。如果你是中文搜索场景的重度用户,这插件值得一试。
下载地址
用户评论