我是靠谱客的博主 虚拟发卡,最近开发中收集的这篇文章主要介绍【Hive】用sort_array和collet_list对一组数字进行排序,取最大值或最小值,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
背景
需要对hive某个map类型的info字段的value进行排序。
"value":"{-15, -56, -75, -32, -61}"
目标是要得到排好序的数组,以便取这组数据中的最大值和最小值。
[-75, -61, -56, -32, -15]
思路
在不写UDF的情况下对map中value的数字进行排序,可以把这组数字放到一个数组中,对数组进行排序后,下标第一个和最后一个元素分别对应最小值和最大值。
主要运用了sort_array 以及 explode和collect_list的用法。sort_array函数默认是升序的。
代码
select
sorted_array[0] as min_number --最小值
,sorted_array[size(sorted_array)-1] as max_number --最大值
from
(
select sort_array(collect_list(cast (number as double))) as sorted_array --排序好的数组
from
(
select regexp_replace(regexp_replace( info['value'], '\{', ''), '\}', '') as value
from table1
) a
lateral view explode(split(value, ',')) tb as number
) b
最后
以上就是虚拟发卡为你收集整理的【Hive】用sort_array和collet_list对一组数字进行排序,取最大值或最小值的全部内容,希望文章能够帮你解决【Hive】用sort_array和collet_list对一组数字进行排序,取最大值或最小值所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复