Flink算子间数据传递模式

333 阅读 0 评论 220 点赞

我是靠谱客的博主受伤红牛，这篇文章主要介绍Flink算子间数据传递模式，现在分享给大家，希望可以做个参考。

算子之间传输数据的形式可以是one-to-one (forwarding)的模式也可以是redistributing的模式，具体是哪一种形式，取决于算子的种类。
在这里插入图片描述

One-to-one： Stream(比如在 source 和 map operator 之间)维护着分区以及元素的顺序。那意味着 map 算子的子任务看到的元素的个数以及顺序跟 source 算子的子任务生产的元素的个数、顺序相同，map、fliter、flatMap 等算子都是 one-to-one 的对应关系（类似于 spark 中的窄依赖）。
Redistributing： Stream(map()跟 keyBy/window 之间或者 keyBy/window 跟 sink 之间)的分区会发生改变。每一个算子的子任务依据所选择的 transformation 发送数据到不同的目标任务。例如，keyBy() 基于 hashCode 重分区、broadcast 和 rebalance 会随机重新分区，这些算子都会引起 redistribute 过程，而 redistribute 过程就类似于Spark 中的 shuffle 过程（类似于Spark 中的宽依赖）。

相同并行度的 one to one 操作， Flink 这样相连的算子链接在一起形成一个 task，原来的算子成为里面的一部分。将算子链接成 task 是非常有效的优化：它能减少线程之间的切换和基于缓存区的数据交换，在减少时延的同时提升吞吐量。

关注公众号 数据工匠记 ，专注于大数据领域离线、实时技术干货定期分享！个人网站 www.lllpan.top
在这里插入图片描述

最后

以上就是受伤红牛最近收集整理的关于Flink算子间数据传递模式的全部内容，更多相关Flink算子间数据传递模式内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(220)

本文分类：Flink
浏览次数：333 次浏览
发布日期：2023-10-21 23:51:01

相关文章

Error creating bean with name ‘processEngine‘: FactoryBean threw exception on object creation； nest

Error creating bean with name ‘processEngine‘: FactoryBean threw exception on object creation； nest

spark读写hdfs后出现的异常错误

spark读写hdfs后出现的异常错误

spark报错：java.io.IOException: Filesystem closed

spark报错：java.io.IOException: Filesystem closed

Spark问题5之ERROR LiveListenerBus SparkListenerBus has already stopped1.问题描述2.解决办法：

Spark问题5之ERROR LiveListenerBus SparkListenerBus has already stopped1.问题描述2.解决办法：

Flink算子间数据传递模式

spark 处理大量数据时报错： ERROR scheduler.LiveListenerBus: Listener EventLoggingListener threw an exception j

spark 处理大量数据时报错： ERROR scheduler.LiveListenerBus: Listener EventLoggingListener threw an exception j

【异常】SparkStreaming抛出Listener SQLListener threw an exception异常

【异常】SparkStreaming抛出Listener SQLListener threw an exception异常

spark ListenerBus 监听器

spark ListenerBus 监听器

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部