Hadoop学习(3)——Mapreduce案例分析
一、天气案例:细粒度介绍计算框架(1)需求:找出每个月气温最高的2天(2)思路每年 每个月 最高 2天 1天多条记录?进一部思考:年月分组 温度升序 key中要包含时间和温度呀!MR原语:相同的key分到一组,通过GroupCompartor设置分组规则(3)实现具体思路自定义数据类型Weather:包含时间 包含温度 自定义排序比较规则自定义分组比较:年月相同被视为相同的key那么reduce迭代时,相同年月的记录有可能是同一天的:reduc