自然未来

文章
2
资源
0
加入时间
3年1月13天

Spark基本知识01 二、RDD算子

一、RDD概念以及五大特性1.概念: RDD是Resilient Distributed Dataset(弹性分布式数据集)的简称。 实际上是一个数据的描述,它记录了要分析的数据所存的节点和块的大小和副本的数量等等元数据信息,当然还包括要计算的一些逻辑 分布式的数据集,是一种数据描述,不可变,可分区,可并行计算的集合。2.弹性的体现: 自动...