1. 首页
  2. 编程语言
  3. Java
  4. 中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法

中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法

上传者: 2019-05-06 13:54:20上传 ZIP文件 10.41MB 热度 47次
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch插件。分词使用方法:1、快速体验运行项目根目录下的脚本demo-word.bat可以快速体验分词效果用法:command[text][input][output]命令command的可选值为:demo、text、filedemotext杨尚川是APDPlat应用级产品开发平台的作者filed:/text.txtd:/word.txtexit2、对文本进行分词移除停用词
用户评论
码姐姐匿名网友 2019-05-06 13:54:20

可以使用,感觉挺好用的

码姐姐匿名网友 2019-05-06 13:54:20

不错不错,辛苦了

码姐姐匿名网友 2019-05-06 13:54:20

不错,比较好用的一款分词工具了。准确率和速度都还可以。

码姐姐匿名网友 2019-05-06 13:54:20

超级好用,速度非常快,操作简单