1. 首页
  2. 数据库
  3. 其它
  4. Hadoop二次开发必懂

Hadoop二次开发必懂

上传者: 2021-02-01 18:54:28上传 PDF文件 716.16KB 热度 5次
大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花很多的时间去介绍HDFS的背景,毕竟大家对文件系统的还是有一定的理解的,而且也有很好的文档。在分析Hadoop的MapReduce部分前,我们还是先了解系统是如何工作的,然后再进入我们的分析部分。下面的图来是我看到的讲MapReduce最好的图。以Hadoop带的wordcount为例子(下面是启动行):用户提交一个任务以后,该任务由JobTracker协调,先执行Map阶段(图中M1,M2和M3),然后执行Reduce阶段(图中R1和R2)。Map阶段和Reduce阶段动作都受TaskTracker监控,并运行在独立于TaskTrack
用户评论