Pyhon数据分析项目——文档相似性比较.pdf
用Python 玩转数据项目文档相似性比较 相似性比较算法在许多领域有着重要应用在剽窃检测方面相似性比较算法可以帮助 检查抄袭在代码管理方面可以帮助查找大型代码的相似部分以便进一步优化与修改 在存储方面可以帮助检测冗余等等 借助Python我们可以比较简单地实现一些复杂的相似性算法 相似性比较算法有很多种类这里介绍的winnowing 算法基于2003 年的一篇论文 一算法原理和背景知识 算法将
下载地址
用户评论