AutoPhrase:AutoPhrase:Massive Text Corpora中的自动短语挖掘 源码
自动短语:从大量文本语料库中自动进行短语挖掘 刊物 如果您使用的是我们的工具,请引用以下两篇论文。 谢谢! 尚静波,刘加禄,姜萌,任翔,Clare R Voss,韩佳玮,“”,被IEEE Transactions on Knowledge and Data Engineering,2018年2月接受。 刘加鲁*,尚静波*,王驰,任翔和韩佳伟,“”,2015年ACM SIGMOD国际数据管理大会(SIGMOD'15),澳大利亚墨尔本,2015年5月。(*同样贡献, ) 近期变动 2020.06.14 用git master更新docker镜像 2018.03.04 修复了预处理和后处理过程中的一些错误,即Tokeninzer.java 。 以前,当语料库包含/之类的字符时,结果可能是错误的,或者可能发生错误。 当短语分段提供新文本时,对于知识库( wiki_quality.txt
下载地址
用户评论