Hadoop之图解MapReduce与WordCount示例分析1、MapReduce整体流程
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。 HDFS是Google File System(GFS)的开源实现,MapReduce是Google MapReduce的开源实现。 HDFS和MapReduce实现是完全分离的,并不是没有HDFS就不能MapReduce运算。本文主要参考