redisCluster 缓存节点的扩展和收缩故障发现和恢复

307 阅读 0 评论 203 点赞

我是靠谱客的博主潇洒斑马，这篇文章主要介绍redisCluster 缓存节点的扩展和收缩故障发现和恢复，现在分享给大家，希望可以做个参考。

在集群中任意节点执行 cluster meet 命令让新节点加入进来。假设新节点是 192.168.1.1 5002，老节点是 192.168.1.1 5003，那么运行以下命令将新节点加入到集群中。

192.168.1.1 5003> cluster meet 192.168.1.1 5002

这个是由老节点发起的，有点老成员欢迎新成员加入的意思。新节点刚刚建立没有建立槽对应的数据，也就是说没有缓存任何数据。

如果这个节点是主节点，需要对其进行槽数据的扩容；如果这个节点是从节点，就需要同步主节点上的数据。总之就是要同步数据。

客户端对目标节点发起准备导入槽数据的命令，让目标节点准备好导入槽数据。这里使用 cluster setslot {slot} importing {sourceNodeId} 命令。
之后对源节点发起送命令，让源节点准备迁出对应的槽数据。使用命令 cluster setslot {slot} importing {sourceNodeId}。
此时源节点准备迁移数据了，在迁移之前把要迁移的数据获取出来。通过命令 cluster getkeysinslot {slot} {count}。Count 表示迁移的 Slot 的个数。
然后在源节点上执行，migrate {targetIP} {targetPort} “” 0 {timeout} keys{keys} 命令，把获取的键通过流水线批量迁移到目标节点。
重复 3 和 4 两步不断将数据迁移到目标节点。目标节点获取迁移的数据。
完成数据迁移以后目标节点，通过 cluster setslot {slot} node {targetNodeId} 命令通知对应的槽被分配到目标节点，并且广播这个信息给全网的其他主节点，更新自身的槽节点对应表。

迁移的过程也与上线操作类似，不同的是下线的时候需要通知全网的其他节点忘记自己，此时通过命令 cluster forget{downNodeId} 通知其他的节点

故障发现和恢复

主观下线超时还未ping通集群其他节点，则认为该节点主观下线

客观下线 集群内的节点会不断收到下线报告，当半数以上持有槽的主节点标记了某个节点是主观下线时，便会触发客观下线的流程

一旦发现下线会走如下的恢复流程：

①资格检查，每个节点都会检查与主节点断开的时间。如果这个时间超过了 cluster-node-timeout*cluster-slave-validity-factor（从节点有效因子，默认为 10），那么就没有故障转移的资格。

也就是说这个从节点和主节点断开的太久了，很久没有同步主节点的数据了，不适合成为新的主节点，因为成为主节点以后其他的从节点回同步自己的数据。

②触发选举，通过了上面资格的从节点都可以触发选举。但是出发选举是有先后顺序的，这里按照复制偏移量的大小来判断。

这个偏移量记录了执行命令的字节数。主服务器每次向从服务器传播 N 个字节时就会将自己的复制偏移量+N，从服务在接收到主服务器传送来的 N 个字节的命令时，就将自己的复制偏移量+N。

复制偏移量越大说明从节点延迟越低，也就是该从节点和主节点沟通更加频繁，该从节点上面的数据也会更新一些，因此复制偏移量大的从节点会率先发起选举。

③发起选举，首先每个主节点会去更新配置纪元（clusterNode.configEpoch），这个值是不断增加的整数。

在节点进行 Ping/Pong 消息交互式也会更新这个值，它们都会将最大的值更新到自己的配置纪元中。

这个值记录了每个节点的版本和整个集群的版本。每当发生重要事情的时候，例如：出现新节点，从节点精选。都会增加全局的配置纪元并且赋给相关的主节点，用来记录这个事件。

说白了更新这个值目的是，保证所有主节点对这件“大事”保持一致。大家都统一成一个配置纪元（一个整数），表示大家都知道这个“大事”了。

更新完配置纪元以后，会想群内发起广播选举的消息（FAILOVER_AUTH_REQUEST）。并且保证每个从节点在一次配置纪元中只能发起一次选举。

④投票选举，参与投票的只有主节点，从节点没有投票权，超过半数的主节点通过某一个节点成为新的主节点时投票完成。

如果在 cluster-node-timeout*2 的时间内从节点没有获得足够数量的票数，本次选举作废，进行第二轮选举。

这里每个候选的从节点会收到其他主节点投的票。在第2步领先的从节点通常此时会获得更多的票，因为它触发选举的时间更早一些。

获得票的机会更大，也是由于它和原主节点延迟少，理论上数据会更加新一点。

⑤当满足投票条件的从节点被选出来以后，会触发替换主节点的操作。新的主节点别选出以后，删除原主节点负责的槽数据，把这些槽数据添加到自己节点上。

并且广播让其他的节点都知道这件事情，新的主节点诞生了。

最后

以上就是潇洒斑马最近收集整理的关于redisCluster 缓存节点的扩展和收缩故障发现和恢复的全部内容，更多相关redisCluster内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(203)

本文分类：redis
浏览次数：307 次浏览
发布日期：2023-10-20 16:20:58

相关文章

阿里P8架构师谈：高并发与多线程的关系、区别、高并发的技术方案

阿里P8架构师谈：高并发与多线程的关系、区别、高并发的技术方案

使用Redis做过异步队列吗，是如何实现的？

使用Redis做过异步队列吗，是如何实现的？

php多种权限,php系列（五）权限控制的思考

php多种权限,php系列（五）权限控制的思考

基数统计算法 HyperLogLog、布隆过滤器、缓存雪崩、缓存穿透、内存淘汰策略、redis性能测试、redis 慢查询、哨兵、Git

基数统计算法 HyperLogLog、布隆过滤器、缓存雪崩、缓存穿透、内存淘汰策略、redis性能测试、redis 慢查询、哨兵、Git

redisCluster 缓存节点的扩展和收缩故障发现和恢复

redisCluster 缓存节点的扩展和收缩故障发现和恢复

$PHPCMS \phpcms\modules\member\index.php 用户登陆SQL注入漏洞分析$

PHPCMS \phpcms\modules\member\index.php 用户登陆SQL注入漏洞分析

阿里云云视频会议

redis那些事之缓存击穿、缓存雪崩、缓存穿透

redis那些事之缓存击穿、缓存雪崩、缓存穿透

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部