“戏”说spark---资源调度和任务调度
在“戏”说Spark-spark运行模式简解一文中不管是以client或者是以cluster的方式提交到Standalone上还是提交到yarn上,我们就概括性的描述了提交运行的流程,大概就是创建Driver,申请资源,分发任务,执行任务,返回结果这么一个过程。在“戏”说Spark-Spark核心-Stage划分及Pipline的计算模式一文中,我们详细的了解了RDD宽窄依赖的划分是为了Stage的划分,Stage的划分是为了实现再依赖组成的stage里面的Pipline的计算模型,那Spark