我是
靠谱客的博主
专注跳跳糖,这篇文章主要介绍
Hive_表优化,现在分享给大家,希望可以做个参考。
表优化
案例





二






三




设置多个 reducer

生产中 reducer 有 很多个 ,所以会产生数据倾斜 ,那么我们随机分布空 值 ,按什么呢 ,


对比 ,解决数据倾斜

MapJoin


Group By


Count Distinct 去重统计



尽量避免 ,笛卡尔积

行列过滤

MR 优化


小文件合并


复杂文件增加Map 数量


合理设置 Reduce 数量



并行执行


设置本地模式

最后
以上就是专注跳跳糖最近收集整理的关于Hive_表优化的全部内容,更多相关Hive_表优化内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复