积极小甜瓜

文章
5
资源
0
加入时间
2年10月21天

HIVE实战处理(九) hive函数sort_array解决排序求最大值以及collet_list列表排序混乱

背景:播放数据有2个来源,根据2个来源取每个用户最大的播放时长作为最后结果。因为sort_array不支持倒序排列,只能根据arr[1]来确认是最大值(因为只有2个数据源)select arr,arr[0],arr[1]from (select name, collect_list(play_duration_ms) , sort_array(collect_list(play_duration_ms)) arr, arr[1] --最大的播放时长 --sort_array(ar

重构 改善既有代码的设计之大型重构 总结

Tease Apart Inheritance(梳理并分解继承体系)某个继承体系同时承担两项责任建立两个继承体系 并通过委托关系让其中一个可以调用另一个Convert Procedural Design to Objects(将过程化设计转化为对象设计)你手上有一些传统过程化风格的代码将数据记录变成对象 将大块的行为分成小块 并将行为移入相关对象之中Separate Domain fr...