Spark中的角色介绍
Spark 是基于内存计算的大数据并行计算框架。因为其基于内存计算,比Hadoop 中 MapReduce 计算框架具有更高的实时性,同时保证了高效容错性和可伸缩性。从 2009 年诞生于 AMPLab 到现在已经成为 Apache 顶级开源项目,并成功应用于商业集群中,学习 Spark 就需要了解其架构。Spark 架构图如下:Spark架构使用了分布式计算中master-sla...