我是靠谱客的博主 专注跳跳糖,这篇文章主要介绍Hive_表优化,现在分享给大家,希望可以做个参考。

表优化

案例 

设置多个 reducer 

 

生产中 reducer 有 很多个 ,所以会产生数据倾斜    ,那么我们随机分布空 值   ,按什么呢  ,

 对比 ,解决数据倾斜

 

MapJoin

Group By

Count Distinct 去重统计

尽量避免 ,笛卡尔积

行列过滤

MR 优化

 

小文件合并

 

复杂文件增加Map 数量

 

合理设置 Reduce 数量

 

并行执行

 

设置本地模式

 

 

最后

以上就是专注跳跳糖最近收集整理的关于Hive_表优化的全部内容,更多相关Hive_表优化内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部