傲娇书包

文章
8
资源
1
加入时间
2年10月17天

SparkRDD未持久化——持久化

RDD的持久化策略:  cache、persist、checkpoint三种策略(持久化的单位是partition)1、cache是persist的一个简化版,会将rdd中的数据持久化到内存中  cache = persists(StorageLevel.MEMORY_ONLY) 不进行序列化特点:  cache的返回值 必须赋值给一个新的RDD变量, 在其他的job中直接使用这...