spark任务中基于rdd的执行流程分析 下面是rdd的论文中,从hdfs读取日志数据的一个例子:lines = spark.textFile("hdfs://...") // lines is a org.apache.spark.rdd.MappedRDDerrors = lines.filter(_.startsWith("ERROR"))// e Spark 分布式内存计算模型 2023-12-07 164 点赞 2 评论 248 浏览