hadoop 实战练习_Hadoop实例练习(一)
实现目标:在对文档进行单词词频计算的同时,对输出结果按单词的词频进行排序设计思路:用一个并行计算任务显然是无法同时完成单词词频统计和排序的。为什么无法同时完成呢?想一下单词词频统计任务的MapReduce过程:在Map阶段,Mapper将作为输入的n个文档分割为对应的n(或n个以上)个InputSplits,每个InputSplits分配给一个Mapper--> 调用RecordReader...