1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于VSM的文本相似度计算的研究.pdf

论文研究基于VSM的文本相似度计算的研究.pdf

上传者: 2019-09-09 04:58:57上传 PDF文件 33.62KB 热度 29次
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TDIDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TDIDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。
用户评论