1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于MapReduce的序列模式挖掘算法.pdf

论文研究基于MapReduce的序列模式挖掘算法.pdf

上传者: 2019-07-29 12:12:40上传 PDF文件 1.06MB 热度 49次
针对传统GSP算法需要多次扫描数据库、I/O开销巨大的缺点,提出了一种基于MapReduce编程框架的序列模式挖掘算法MR-GSP(GSPalgorithmbasedonMapReduce)。MR-GSP算法将原序列数据库划分为多个子序列数据库并分发到多个Map节点,Map函数扫描存放在Map节点内存中的子序列数据库,产生局部序列模式,Reduce函数对所有局部序列模式合并,扫描原序列数据库,计算局部序列模式的支持度,得到最终的序列模式。相比于传统GSP算法,MR-GSP算法只需扫描两次原始数据库即可得到所有序列模式。实验结果表明,MR-GSP算法在对大数据集进行序列模式挖掘时,可充分利用云计算技术的优势,提高挖掘效率。
用户评论