积极小甜瓜

文章
5
资源
0
加入时间
2年10月21天

HIVE实战处理(九) hive函数sort_array解决排序求最大值以及collet_list列表排序混乱

背景:播放数据有2个来源,根据2个来源取每个用户最大的播放时长作为最后结果。因为sort_array不支持倒序排列,只能根据arr[1]来确认是最大值(因为只有2个数据源)select arr,arr[0],arr[1]from (select name, collect_list(play_duration_ms) , sort_array(collect_list(play_duration_ms)) arr, arr[1] --最大的播放时长 --sort_array(ar