1. 首页
  2. 数据库
  3. 其它
  4. Hadoop中MapReduce基本案例及代码(三)

Hadoop中MapReduce基本案例及代码(三)

上传者: 2021-02-01 14:21:33上传 PDF文件 101.15KB 热度 18次
分区Partitioner 分区操作是shuffle操作中的一个重要过程,作用就是将map的结果按照规则分发到不同reduce中进行处理,从而按照分区得到多个输出结果。 Partitioner是partitioner的基类,如果需要定制partitioner也需要继承该类HashPartitioner是mapreduce的默认partitioner。 计算方法是:which reducer=(key.hashCode() & Integer.MAX_VALUE) % numReduceTasks 注:默认情况下,reduceTask数量为1 很多时候MR自带的分区规则并不能满足我们需求,为了实
用户评论