MapReduce(MR)框架里shuffer过程中Partition的使用
Partitioner类:主要在Shuffle过程中按照Key值将中间结果分成R份,其中每份都有一个Reduce去负责。使用的时候可以通过job.setPartitionerClass()方法进行设置,实现getPartition函数,默认的使用hashPartitioner类。举一个简单的例子:在Hdfs文件系统下有这样一个txt,txt的数据如下:红色方框是时间戳时间戳的日期是从8月20到9月...