概述
在自己做实验准备迁移 有key-value的槽的时候,(执行指令是redis-trib.rb reshard)发现会出现报错:
报错内容为:Syntax error ,try CLIENT (LIST|KILL|GETNAME|SETNAME|PAUSE|REPLY)
但是迁移没有key-value的槽的时候就会执行成功。 这就说明问题出在了存不存在key-value上
我们找到reshard的执行过程:发现具体迁移步骤是通过 move_slot函数调用(redis-trib.rb文件中)。
打开move_slot函数,找到具体的迁移代码。
while true
keys = source.r.cluster("getkeysinslot",slot,o[:pipeline])
break if keys.length == 0
begin
source.r.client.call(["migrate",target.info[:host],target.info[:port],"",0,@timeout,"replace",:keys,*keys])
STDOUT.flush
rescue => e
if o[:fix] && e.to_s =~ /BUSYKEY/
xputs "*** Target key exists. Replacing it for FIX."
source.r.client.call(["migrate",target.info[:host],target.info[:port],"",0,@timeout,:replace,:keys,*keys])
else
puts ""
xputs "[ERR] Calling MIGRATE: #{e}"
exit 1
end
end
红色代码部分则就是rb脚本告知客户端执行迁移带key-value槽的指令。
我们会发现该指令的具体调用时,等同于
“client migrate target.info[:host],target.info[:port],"",0,@timeout,:replace,:keys,*keys]”
问题来了,这条指令在服务器中怎么执行的呢?
它先执行networking.c 文件中的 clientCommand(client *c)
根据参数一一比对(if条件语句)。这时候就会发现bug来了!!!clientCommand函数中没有 migrate分支。
所以会返回一个 Syntax error ,try CLIENT (LIST|KILL|GETNAME|SETNAME|PAUSE|REPLY);
这个错误信息告诉你, Client中只有LIST|KILL|GETNAME|SETNAME|PAUSE|REPLY分支。
那么怎么去修改实现真正的带key迁移的slot呢?
研究源码,cluster.c文件中里面有migrateCommand(client *c)。恍然大悟,故我们只要将rb文件中迁移语句修改为:
source.r.call(["migrate",target.info[:host],target.info[:port],"",0,@timeout,"replace",:keys,*keys])
source.r.call(["migrate",target.info[:host],target.info[:port],"",0,@timeout,:replace,:keys,*keys])
即不执行clientCommand,直接执行migrateCommand。
测试成功。
作者已经将该bug和解决方案已经提交给Redis官网,并被核实回复,官网回复,这是因为ruby的gem不同造成的。以后5.0版本会抛弃redis-trib.rb。直接使用redis-cli客户端实现集群管理。在此之前,大家可以先安装本文的解决方案进行处理。期待抛弃了redis-trib.rb的Redis-5.0。
https://github.com/antirez/redis/issues/5029
最后
以上就是阳光唇彩为你收集整理的Redis - 解决reshard 出现的bug :Syntax error ,try CLIENT (LIST|KILL|GETNAME|SETNAME|PAUSE|REPLY)的全部内容,希望文章能够帮你解决Redis - 解决reshard 出现的bug :Syntax error ,try CLIENT (LIST|KILL|GETNAME|SETNAME|PAUSE|REPLY)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复