Hadoop基础学习笔记系列(八)MapReduce框架、设计原则约束、实例框架栗子:汇总文章词语原则其他
目录框架用户定义栗子:汇总文章词语原则原则上好的键值任务分解设计设计约束一些栗子cascadejoin:基于key组合表向量乘法:A x B其他理念:Bring computation to DATA框架何时使用?数据需要经常update——DBMS需要扫描数据——MR用户定义所有数据都会被转换成键值对的形式(基本单元)<key,value>mapper(独立可分,在数据上运行):应用到数据的function,输入:数据,输出:键值对reducer:应用到中间数据的f