1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究一种基于熵的文本相似性计算方法.pdf

论文研究一种基于熵的文本相似性计算方法.pdf

上传者: 2019-09-18 02:20:08上传 PDF文件 1.05MB 热度 39次
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。
用户评论