HIVE实战处理(九) hive函数sort_array解决排序求最大值以及collet_list列表排序混乱
背景:播放数据有2个来源,根据2个来源取每个用户最大的播放时长作为最后结果。因为sort_array不支持倒序排列,只能根据arr[1]来确认是最大值(因为只有2个数据源)select arr,arr[0],arr[1]from (select name, collect_list(play_duration_ms) , sort_array(collect_list(play_duration_ms)) arr, arr[1] --最大的播放时长 --sort_array(ar