Hadoop复习笔记一、Hadoop二、MapReduce&Yarn三、Hadoop优化与新特性
一、Hadoop第1章 HDFS概述1.1 HDFS产出背景及定义HDFS(Hadoop Distributed File System),分布式文件系统。通过目录树来定位存储文件,分布式集群系统。应用场景:适合一次写入,多次读出,不支持修改文件。1.2 HDFS优缺点1.3 HDFS组织架构1)NameNode(nn)–Master:(1)管理HDFS的名称空间;(2)配置副本策略;(3)管理数据块映射信息;(4)处理客户单读写请求。2)DataNode(dn)–Salve: