SparkRDD未持久化——持久化
RDD的持久化策略: cache、persist、checkpoint三种策略(持久化的单位是partition)1、cache是persist的一个简化版,会将rdd中的数据持久化到内存中 cache = persists(StorageLevel.MEMORY_ONLY) 不进行序列化特点: cache的返回值 必须赋值给一个新的RDD变量, 在其他的job中直接使用这...