花痴火

文章
5
资源
0
加入时间
2年10月17天

Hadoop编程——第五章:(5)MapReduce自定义对象序列化案例案例1:各州累计病例数量统计一、需求分析二、代码实现

有一份2020-12-01号美国各县county的新冠疫情统计数据,包括累计确诊病例、累计死亡病例。使用MapReduce对疫情数据进行各种分析统计。案例背后的核心是学会自定义MapReduce各个组件。包括自定义对象、序列化、排序、分区、分组。date (日期) , county(县) , state(州 ) , fips(县编码code ) , cases(累计确诊病例) , deaths(索计死亡病例)。MapReduce自定义对象序列化MapReduce自定义排序MapReduce自定义