Spark调优SPARK方面做的优化1 SPARK2 DSL3 SPARK思考
SPARK方面做的优化1 SPARKSpark是一个分布式的计算平台,类同Hadoop的Map/Reduce思想,提出了一个新的数据结构RDD(弹性分布式数据集),在该数据集合上提供了一系列API,更方便开发者使用Spark进行分布式数据处理,同时可高效的使用集群内存。1.1 集群本身针对集群自身的配置参数设置的一些优化,主要是Spark运行时的一些参数设置,例如,任务并行度、Dr