我是靠谱客的博主 羞涩御姐,最近开发中收集的这篇文章主要介绍Spark DF:关于Row中的数值获取问题,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

//json文件
//{"page_id":"87","pay_category_ids":"99","pay_product_ids":"96","city_id":5}
//{"pay_category_ids":"74","city_id":0} 
val df = sparkSession.read.json("./src/data/test")
df.show()
df.rdd.foreach(row => {
    println("getAs: "+row.getAs[String]("page_id"))
    println("isNull: "+row.isNullAt(1))  //
    val tp = row.getAs[String]("page_id")
    println("==Null:",tp == null)
    println("getLong:", row.getString(1))
   })

突然想起之前项目中有些许问题未处理
今天研究一番
从row中get值时, 经常遇到空的问题
简单总结如下:
get数值类型:如果为空, 则转化为0
判空, 建议使用row.isNullAt(index)

get字符串类型:如果为空则为null
判空建议用:StringUtils.isEmpty() (出现""的情况)

总结:获取值用getAsT
判空用row.isNullAt
以及StringUtils.isEmpty()

最后

以上就是羞涩御姐为你收集整理的Spark DF:关于Row中的数值获取问题的全部内容,希望文章能够帮你解决Spark DF:关于Row中的数值获取问题所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(83)

评论列表共有 0 条评论

立即
投稿
返回
顶部