1. 首页
  2. 编程语言
  3. 其他
  4. simhash算法的java实现simhashjava.zip

simhash算法的java实现simhashjava.zip

上传者: 2019-09-05 15:08:24上传 ZIP文件 1.55MB 热度 40次
simhash算法的java实现。特点计算字符串的 simhash通过构建智能索引来计算所有字符串之间的相似性,因此可以处理大数据使用使用输入文件和输出文件运行Maininputfile的格式(参见src/test_in):一个文件每行用utf8字符集outputfile格式 start //start flagfirst line // docsencode lien // doc1\tdist the dist is the hamming distance between doc and doc1 end //end flag
下载地址
用户评论