陶醉白开水

文章
4
资源
0
加入时间
2年10月17天

hive 两个没有null指定的表左关联的结果有null_HIVE-SQL优化(持续更新ing)

hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。其中在开发过程中主要涉及到的可能是SQL优化这块。优化的核心思想是:减少数据量(例如分区、列剪裁);避免数据倾斜(例如加参数、Key打散);避免全表扫描(例如on添加加上分区等);减少job数(例如相同的on条件的join放在一起作为一个任务)。HQL语句优化1、使用分区剪裁、列剪裁在分区剪裁中,当使用外关联时,如果将副表的过滤条件...