1. 首页
  2. 大数据
  3. Hive
  4. 一种基于FP growth的并行SON算法的实现

一种基于FP growth的并行SON算法的实现

上传者: 2020-10-27 21:01:16上传 PDF文件 182.13KB 热度 10次
单节点运行的传统SON算法能够有效降低CPU和I/O负载,而且算法仅需要对整个事务数据集扫描两次。但是在算法执行的阶段一中发现局部频繁项集时采用的Apriori算法仍然需要对每个分区进行多次扫描。在深入研究SON算法的基础上,根据MapReduce编程模型提出了基于FP-growth的SON算法的并行化实现。实验结果表明,基于FP-growth的并行SON算法不仅降低了传统SON算法的运行时间,并且随着分区数目的增加还能获取比较好的加速比。
下载地址
用户评论