hive中合理使用union all与multi insert
对同一张表的union all 要比多重insert快的多,原因是hive本身对这种union all做过优化,即只扫描一次源表;而多重insert也只扫描一次,但应为要insert到多个分区,所以做了很多其他的事情,导致消耗的时间非常长;希望大家在开发的时候多测,多试!lxw_test3 12亿左右记录数Union all : 耗时7分钟左右 cr...