spark任务中基于rdd的执行流程分析 下面是rdd的论文中,从hdfs读取日志数据的一个例子:lines = spark.textFile("hdfs://...") // lines is a org.apache.spark.rdd.MappedRDDerrors = lines.filter(_.startsWith("ERROR"))// e Spark 分布式内存计算模型 2023-12-07 38 点赞 0 评论 57 浏览