simhash算法库simhash.zip 上传者:宛陵秋 2019-09-21 19:30:41上传 ZIP文件 4.37MB 热度 37次 专门针对中文文档的simhash算法库简介此项目用来对中文文档计算出对应的simhash值。simhash是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。详见SimhashBlog特性使用 CppJieba 作为分词器和关键词抽取器使用 jenkins 作为hash函数hpp 风格,所有源码都是 .hpp 文件里面,方便使用。 没有链接,就没有伤害。依赖g(version>=4.1recommended),orclang.用法mkdir build cd buildcmake ..make演示./bin/simhash.demo结果如下:文本:"我是 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论 宛陵秋 资源:19545 粉丝:0 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com