MR自定义分区的实现
MR默认使用的是Hash分区,容易造成数据倾斜。为此,我们可以使用自定义分区避免。代码实现:1.自定义分区类,继承Partitioner类package com.aura.hadoop.partitioner;import com.aura.hadoop.flow.bean.FlowBean;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Partitioner;/** * @author pang