1. 首页
  2. 编程语言
  3. Java
  4. 去重算法Similarity

去重算法Similarity

上传者: 2018-12-21 10:14:43上传 RAR文件 15.35KB 热度 61次
实现了SimHash算法、MinHash算法、Shingling算法、汉明距离、Jaccard Index。供初学者参考
下载地址
用户评论
码姐姐匿名网友 2018-12-21 10:14:43

算法比较全,但是实现比较简单

码姐姐匿名网友 2018-12-21 10:14:43

很好,解决了问题

码姐姐匿名网友 2018-12-21 10:14:43

还是很不错的,可以好好看看学习一下~~

码姐姐匿名网友 2018-12-21 10:14:43

算法比较全,相似有对比,不错的学习资料、

码姐姐匿名网友 2018-12-21 10:14:43

程序没问题,不过实现太基础,shingling只是取词比较没有生成摘要指纹,不适合用于实际项目参考

码姐姐匿名网友 2018-12-21 10:14:43

非常全面,有参考价值,值得研究,我可以借助他们用C实现

码姐姐匿名网友 2018-12-21 10:14:43

算法比较全,有何多计算similarity的算法,不错的资源。

码姐姐匿名网友 2018-12-21 10:14:43

java写的,需要C++,自己琢磨改写吧,谢谢作者

码姐姐匿名网友 2018-12-21 10:14:43

算法比较全,测试例子还得琢磨一下才能明白