RDD编程 1 RDD创建RDD创建有两种形式,1:从外部读取数据源,外部可指本地系统、HDFS系统等;2:调用SparkContext的parallelize方法,在Driver中一个已经存在的集合(数组)上创建。1.1 演示前提启动hadoop和spark-shell>>start-dfs.sh //启动hadoop>>sprak-shell //启动spark&... 大数据 2023-12-07 140 点赞 2 评论 212 浏览