概述
Hadoop官网
http://hadoop.apache.org/
Hadoop来源
- GFS -> HDFS
- MapReduce -> MapReduce
- BigTable -> HBase
Common
The common utilities that support the other Hadoop modules.
- 工具、基础、为工程服务
HDFS
A distributed file system that provides high-throughput access to application data.
- 存储海量数据
- 分布式
- 安全性:副本数据
- 数据是以block的方式进行存储的
YARN
A framework for job scheduling and cluster resource management.
- 分布式资源管理框架
- 管理整个集群的资源(内存、CPU核数)
- 分配调度集群的资源
MapReduce
A YARN-based system for parallel processing of large data sets.
- 对海量数据的处理
- 分布式
- 思想:分而治之。
- 大数据集分为小的数据集,进行逻辑业务处理(map),合并统计数据集结果(reduce)
Hadoop生态圈
转载于:https://www.cnblogs.com/Grand-Jon/p/10117137.html
最后
以上就是妩媚月饼为你收集整理的2、Hadoop 2.X 概述及生态系统的全部内容,希望文章能够帮你解决2、Hadoop 2.X 概述及生态系统所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复