Spark性能优化(5)—— 使用序列化的持久化级别1 使用序列化的持久化级别
1 使用序列化的持久化级别处理对多次使用的 RDD 进行持久化操作之外,还可以进一步优化其性能。因为很可能,RDD 的数据时持久化到内存,或者磁盘中的。那么,此时如果内存大小不是特别充足,完全可以使用序列化的持久化级别,比如 MEMORY_ONLY_SER,MEMORY_AND_DISK_SER等。使用 RDD.persist(StorageLevel.MEMORY_ONLY_SER)这样的...