使用同义词词林扩展版的词语相似度计算剖析
本例是基于《哈工大信息检索研究中心同义词词林扩展版》做的,其中详细分析了将源文件差拆分成五层结构,并对同义词计算,进行了跟踪分析。其中根目录下的Synonymy是项目文件|||Synonymy/text-file中的origin.txt其实就是根目录下的:xx词林扩展版.txt|||SliceArrangement.java是我自己手写的拆分方法,但是比较慢。期待改良。|||CiLin.java|||来源于网上的计算方法(具体参照了田久乐先生的论文中所提出的计算方法,详情请参照:基于同义词词林的词语相似度计算方法.pdf)|||AboutCiLin.java|||剖析了词林的利弊。
用户评论