set sketch paper:SetSketch:填补MinHash和HyperLogLog之间的空白 源码
SetSketch:填补MinHash和HyperLogLog之间的空白 该存储库包含源代码,可重现论文“ SetSketch:填补MinHash和HyperLogLog之间的空白”( )中提出的所有结果和图形。 抽象 MinHash和HyperLogLog是草绘算法,对于大数据应用程序中的集合摘要而言已成为必不可少的算法。 HyperLogLog允许以很小的空间对不同元素进行计数,而MinHash适用于集合的快速比较,因为它可以估计Jaccard相似度和其他联合数量。 这项工作提出了一个名为SetSketch的新数据结构,该结构能够不断填补两个用例之间的空白。 它的可交换和幂等的插入操作以及
用户评论