1. 首页
  2. 编程语言
  3. Java
  4. JAVA版本,每秒约10万汉字,基于词典的中文纯文本分词程序

JAVA版本,每秒约10万汉字,基于词典的中文纯文本分词程序

上传者: 2019-05-17 06:37:20上传 RAR文件 121.9KB 热度 18次
java版本基于词典匹配,速度为每秒约10万个汉字,本人测试。同时生成倒排索引,倒排索引包含了对于分词的相关信息,如词频。若有Bug可与我联系。
用户评论
码姐姐匿名网友 2019-05-17 06:37:20

非常好,很好用

码姐姐匿名网友 2019-05-17 06:37:20

简单,使用,挺快的分词。

码姐姐匿名网友 2019-05-17 06:37:20

请作者简要说一下思路吧。代码没有注释看着很头疼

码姐姐匿名网友 2019-05-17 06:37:20

请问,在这句代码中con=JDBCUTIL.connectToOracle.getConnection(); 提示JDBCUTIL未定义是怎么回事?这个是在哪里定义的?还是因为少了什么包?