1. 首页
  2. 信息化
  3. IT管理
  4. 基于汉明距离的文本相似度计算

基于汉明距离的文本相似度计算

上传者: 2019-02-25 01:46:17上传 PDF文件 97.77KB 热度 23次
传统的文本分类中相似度的计算, 是根据欧氏空间中向量之间夹角的余弦值来表征的, 它根据余弦值的大小来 反映文本之间的相互关系。该文则首先建立文本集与码字集之间的 #.# 对应关系,然后借用编码理论中汉明距离的概 念, 由汉明距离的计算公式, 得到了一种全新的文本相似度的计算方法, 与传统的方法相比较, 它具有简便, 快速等优点。
用户评论
码姐姐匿名网友 2019-02-25 01:46:17

不错的算法代码