我是靠谱客的博主 完美奇异果,最近开发中收集的这篇文章主要介绍Spark 的角色理解,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Master节点主要完成集群管理器的中心化部分,作用是分配Application 到Worker节点,维护Worker节点,Driver,Application的状态,Worker节点负责具体业务的运行。
在这里插入图片描述
Driver端的主要作用是:初始化SparkContext 与Spark集群进行通信,真正执行sc.textFile() , map,flatmap() 都是在Executor中进行执行的。
上图是Spark的四种模式 分别是Local Local-Cluster Standalone Yarn Mesos 模式,四种模式之间相互独立互不相关,四种模式的区别在于上图所示的Cluster Manager 的不同。一个Worker节点可以有多个的Executor。
在Driver端只是进行提交操作,初始化SparkContext,new 对象等操作,比如在Driver端创建了一个数组,Executor中需要用到这个数组,这时候就会把数据发送到Executor中。

collect() 的作用是将Executor中的内容抓取到Driver端进行展示。

最后

以上就是完美奇异果为你收集整理的Spark 的角色理解的全部内容,希望文章能够帮你解决Spark 的角色理解所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部