MapReducer
MapReducer是一种编程模型 面向大数据并行处理的一种计算模型,框架和平台基本特点:分布可靠,对数据集的操作分发给多个集群中的多个节点实现可靠性,每个节点周期性返回它完成的任务和最新状态封装实现了细节,基于框架API编程,面向业务 展开分布式编码提供跨语言编程的能力运行流程:map阶段和reducer阶段map:由map task组成输入数据解析格式InputFormat输入数据处理 Mapper数据区分 Partitione...