Kafka数据倾斜到某一个分区解决方案1、原因：2、解决：

333 阅读 0 评论 220 点赞

我是靠谱客的博主高挑蓝天，这篇文章主要介绍Kafka数据倾斜到某一个分区解决方案1、原因：2、解决：，现在分享给大家，希望可以做个参考。

1、原因：

我们使用Kafka时，某时需要消息消费是有序的，因此在生产者投递消息时，可能会指定分区，或者指定Key，此时可能会导致数据倾斜到某一个分区。

由于Kafka消费的特性，即一个消费组，那怕此时消费组有2个以上消费者，此时同一个主分区，只能被一个消费者消费，当生产消息大于消费消息时，就会出现单一分区数据倾斜。

2、解决：

根本原因，当指定分区，或者指定Key投递消息时。生产消息大于消费消息时，出现单一分区数据倾斜，此时消费端不能水平扩展。解决方案：

1、优化消费端的消费能力，如原来是200ms，优化后是50ms，当然可能无法优化;

2、二次消费用多个topic分摊分流消息，详细如下：

在消费端判定是哪个分区发生倾斜；
为这个发生倾斜的分区，建多个topic分摊分流，二次投递消费，水平扩展服务器；
topic分摊分流，根据指定的Key，弄一个算法，以确保相同的Key落在同一个分区；

最后

以上就是高挑蓝天最近收集整理的关于Kafka数据倾斜到某一个分区解决方案1、原因：2、解决：的全部内容，更多相关Kafka数据倾斜到某一个分区解决方案1、原因内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(220)

本文分类：消息中间件
浏览次数：333 次浏览
发布日期：2023-12-07 09:55:52

相关文章

MapReduce之自定义partitioner

MapReduce之自定义partitioner

MapReduce面试题---空箱、冰调、洗衣机系列(不走寻常路系列)

MapReduce面试题---空箱、冰调、洗衣机系列(不走寻常路系列)

sum over partition by 的用法

sum over partition by 的用法

kafka获得最新partition offset

kafka获得最新partition offset

Kafka数据倾斜到某一个分区解决方案1、原因：2、解决：

Kafka数据倾斜到某一个分区解决方案1、原因：2、解决：

partition-equal-subset-sum

partition-equal-subset-sum

SQL的各种SUM，示例看用group by、partition by的实现方式

SQL的各种SUM，示例看用group by、partition by的实现方式

Partition Equal Subset Sum解题报告

Partition Equal Subset Sum解题报告

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部