背后航空

文章
6
资源
0
加入时间
3年0月8天

从零到一spark进阶之路(一)

从零到一spark进阶之路(一)1.RDDRDD是spark特有的数据模型,谈到RDD就会提到什么弹性分布式数据集,什么有向无环图,本文暂时不去展开这些高深概念。(0)随便找个点理解以下最重要的记住,RRD是不可变的,也就是说,已有的RDD不能被修改或者更新,但可以从已有的RDD转化成一个新的RDD.上面的特性解读: RDD可以cache到内存中,每次对RDD数据集的操作...