基于MapReduce框架的Apriori算法改进.doc
随着计算机的普及和网络的发展,电子商务正在逐渐兴起,并且每天网络上都会生成大量的TB级别的数据。这些数据大部分是没有什么价值的,但其中一小部分还是有用的,所以从海量的数据中寻找出对于人们有用的数据成为了现在的热门学术,这是有利于社会发展的,数据挖掘也正是因此而诞生的。
关联规则挖掘是数据挖掘中最活跃的研究内容之一,它的目的是在数据库中查找各个项目之间的关联。说起关联规则就不得不提Apriori算法。这算法是一种计算布尔关联规则频繁项目集挖掘的十分经典的算法。Apriori算法使用逐步搜索的方法组合候选集合,然后使用已知的高频数据项集从而来导出剩下高频项集。但是,此算法是无法扩展集群计算,网格
用户评论