我是靠谱客的博主 想人陪红牛,最近开发中收集的这篇文章主要介绍RDD Action 显示,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

RDD Action 显示
val nums  = sc.parallelize(List(1,2,3,6,4,7,5))
nums.collect   //会引起客户端内存溢出


//返回前k 个元素
nums.take(2)


//返回排序后的前k 个元素
nums.takeOrdered(2)


//返回第一个元素
nums.first


//返回随机k个元素
nums.takeSample(true,2) //不替换
nums.takeSample(false,2) //替换


nums.foreach(println)


//合并集合元素
nums(_+_)


key/value 返回一个hashmap 记录每一个key有多少个value
val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey


//将RDD保存到HDFS中
nums.saveAsTextFile("/aa")


val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey
res21: scala.collection.Map[String,Long] = Map(spark -> 1, hadoop -> 1, storm -> 2)

最后

以上就是想人陪红牛为你收集整理的RDD Action 显示的全部内容,希望文章能够帮你解决RDD Action 显示所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(53)

评论列表共有 0 条评论

立即
投稿
返回
顶部