一种基于云计算的大图高频模式挖掘算法
现有的图挖掘算法在云环境下难以有效地进行大规模图形的高频模式挖掘。为此,对SpiderMine算法做了改进,提出一种基于云的SpiderMine算法(c-SpiderMine)。该算法首先利用最小切割算法将大规模图形数据分为多个子图,使分区/融合成本最小,然后利用SpiderMine进行模式挖掘,显著降低了大型模式生成时的组合复杂度。最后采用一种模式键函数来保存模式,以保证所有模式可被成功恢复和融合。基于3种真实数据集的仿真实验结果表明,c-SpiderMine可高效挖掘云环境下的前K个大型模式,在不同数据规模和最小支持设置条件下,c-SpiderMine在内存使用和运行时间方面的性能均优于S
下载地址
用户评论