hive 分区表,桶,倾斜知识点
为什么要引入分区和桶的概念?hive的select会扫描整个表的内容, 引入partition 桶【把hive表的数据划分为快】。partition更粗粒度 桶更细粒度 在小范围的查询上提高效率。分区:partitioned by(分区字段的名字 分区字段的类型)eg partitiond by(time date)静态分区:分区的值是确定的【假设有一个程序,每天都统计销售额,按照日期进行分区 每...