1. 首页
  2. 云计算
  3. Docker
  4. 基于Hadoop集群的多表并行关联算法及应用

基于Hadoop集群的多表并行关联算法及应用

上传者: 2020-11-29 04:45:58上传 PDF文件 207.67KB 热度 10次
针对因特网环境下并行数据库实现多个大数据表关联存在的计算瓶颈,基于 Hadoop集群设计了一个并行关联多个大数据表的简便算法MR_Join。以商业网站凡客诚品的销售数据为例进行实验,验证算法的可行性并做出应用实例。实验结果表明,MR_Join算法可以有效地实现大数据表的快速关联,具有显著的并行效率。
下载地址
用户评论