悲凉老鼠

文章
6
资源
0
加入时间
2年10月24天

【大数据入门核心技术-Hive】(九)HiveSQL数据查询

1、ORDER BY用于全局排序,就是对指定的所有排序键进行全局排序,使用ORDER BY的查询语句,最后会用一个Reduce Task来完成全局排序。因此,如果distribute by和sort by字段是同一个时,此时,cluster by = distribute by + sort by。4、cluster by(字段) 除了具有Distribute by的功能外,还兼具sort by的排序功能。Distribute By:类似MR中partition,进行分区,结合sort by使用