pyspark setcover:解决PySpark的Set Coverage问题的Python包 源码
pyspark-setcover 概要 使用贪心算法打包解决集合覆盖问题,以近似最佳解决方案。 与丢失的设置成本(最小化约束)相比,算法选择集与所覆盖的新元素数量(最大化)相比。 项目目标是实现在PySpark 3,Dask等分布式系统上使用的求解器。 解释 Complexity: U * log(S) Universe U of n elements Subsets S of U: S = (S1, S2, ..., Sm) Where every subset Si has an associated cost. Find a minimum weight subcollect
用户评论