MapReduce模型简介
一:MapReduce模型简介 MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数:Map和Reduce。它采用“分而治之”策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片(split),这些分片可以被多个Map任务并行处理 1.Map和Reduce函数Map和Reduce 2.MapReduce体系结构 MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker