我是靠谱客的博主 粗暴皮带,这篇文章主要介绍Flume容错机制 : Sink Processor,现在分享给大家,希望可以做个参考。

Sink Processors是作用在sink组件上的容错机制。通过调度Sink Groups(就是分了组的Sinks),可以做到负载均衡(load_balance Processors)和类似HDFS中Namenode高可用(Failover Processors )那样的目的。

Failover Sink Processor

NameDefaultDescription
sinks-sink的一个集合,用空格分隔,一个sink不建议分组
processor.typedefaultFailover处理器就设置为failover
processor.priority.-组内某个sink的优先级
processor.maxpenalty30000失败的sink最大回退时间(毫秒)

优先级大的先被调度,如果优先级大的挂了,会找活着的中最大优先级的sink然后让其工作(一直只有一个sink工作),如果这个时候原来那个优先级更大的活过来了,不会抢占位置,直到当前sink挂了才会再次选最大优先级的工作。

load_balance Processors

NameDefaultDescription
sinks-sink的一个集合,用空格分隔,一个sink不建议分组
processor.typedefaultFailover处理器就设置为load_balance
processor.backofffalse以指数级回退失败的sink
processor.selectorround_robin调度方式有round_robinrandom两种,或者自定义的
processor.selector.maxTimeOut30000限制backoff指数的最大值

round_robin:轮询,如果有三个sink配置在组中,会依次调度三个sink

random:随机调度

例子

a1.sources=r1
a1.channels=c1 c2
a1.sinks=k1 k2 k3 k4  #先配置好sinks再为它们分组

# 分配sink组信息
a1.sinkgroups = g1 g2
a1.sinkgroups.g1.sinks= k1 k2 
a1.sinkgroups.g1.processor.type= load_balance
a1.sinkgroups.g1.processor.selector = round_robin

a1.sinkgroups.g2.sinks= k3 k4
a1.sinkgroups.g2.processor.type= failover
a1.sinkgroups.g2.processor.priority.k3 = 5
a1.sinkgroups.g2.processor.priority.k4 = 10
a1.sinkgroups.g2.processor.maxpenalty = 10000

# 再配置你的各个sink就行了

最后

以上就是粗暴皮带最近收集整理的关于Flume容错机制 : Sink Processor的全部内容,更多相关Flume容错机制内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(51)

评论列表共有 0 条评论

立即
投稿
返回
顶部