Redis两种持久化方式AOF和RDB对比

87 阅读 0 评论 58 点赞

我是靠谱客的博主精明鸭子，这篇文章主要介绍Redis两种持久化方式AOF和RDB对比，现在分享给大家，希望可以做个参考。

提示：这是我的个人IT资源网站，所有资源都免费，注册登录后就可以看到密码，需要什么大家尽情选取！
今天我们来看看Redis的持久化，如果只是把Redis作为缓存，在系统启动的时候，从其他地方加载数据到Redis，是没有必要考虑持久化的问题，但是有时候我们的业务可能需要将一部分实时数据存在Redis中，而且这些数据是需要在系统中一直显示的，那么持久化就很重要了，因为一旦Redis关闭，内存中数据就不存在了，那么在重新启动后，我们就无法看到数据，但是做了持久化之后，我们可以把持久化数据在启动的时候重新加载到Redis中，这样就避免了数据的丢失，下面我们来详细看一下Redis的持久化是怎么回事。

RDB
在指定的时间间隔内将内存中的数据集快照写入磁盘，也就是行话讲的Snapshot快照，它恢复时是将快照文件直接读到内存里，Redis会单独创建fork一个子进程来进行持久化，会先将数据写入到一个临时文件中，待持久化过程都结束了，再用这个临时文件替换上次持久化好的文件。整个过程中，主进程是不进行任何IO操作的，这就确保了极高的性能，如果需要进行大规模数据的恢复，且对于数据恢复的完整性不是非常敏感，那么RDB方式要比AOF方式更加的高效，RDB的缺点是最后一次持久化后的数据可能丢失。

Fork的作用是复制一个与当前进程一样的进程。新进程的所有数据（变量、环境变量、程序计数器等）数值都和原进程一致，但是是一个全新的进程，并作为原进程的子进程。
Rdb保存的是dump.rdb文件，文件路径可以在redis.conf中配置，默认为当前路径。
触发条件在redis.conf中，可以自己设置，例如n秒内修改了m次为触发条件，一旦触发条件，则会覆盖之前生成的dump.rdb文件，最好是定期备份dump.rdb文件，因为一旦内存数据丢失，覆盖了dump.rdb文件，而且我们又没有备份文件，那么数据就彻底丢失了，虽然备份的文件的数据不一定是最新的，但是也可以减少损失。
通过save或者bgsave命令，都可以立即生成dump.rdb文件，但是save命令是在主进程上进行操作的，会造成堵塞，只有完成备份，客户端才能连接redis,bgsave命令则是fork(派生)一个save的子进程，不会影响主进程的工作。
RDB是一个非常紧凑的文件
RDB在保存RDB文件时父进程唯一需要做的就是fork出一个子进程，接下来的工作全部由子进程来做，父进程不需要再做其他IO操作，所以RDB持久化方式可以最大化redis的性能。
与AOF相比，在恢复大的数据集的时候，RDB方式会更快一些。
数据丢失风险大
RDB需要经常fork子进程来保存数据集到硬盘上，当数据集比较大的时候，fork的过程是非常耗时的，可能会导致Redis在一些毫秒级不能响应客户端请求。

AOF
以日志的形式来记录每个写操作，将Redis执行过的所有写指令记录下来(读操作不记录)，只许追加文件但不可以改写文件，redis启动之初会读取该文件重新构建数据，换言之，redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

当redis.conf的appendonly为yes，生成aof文件，在重启的时候redis会优先加载aof文件。
当aof文件中有不符合redis语法的内容时，我们可以执行redis-check-aof --fix aof文件，来检查并清除不符合语法的内容。
appendfsync写入磁盘的策略，always：同步持久化，每次发生数据变更会被立即记录到磁盘，性能较差但数据完整性比较好；everysec：出厂默认推荐，异步操作，每秒记录，如果一秒宕机，有数据丢失，no：Redis不会主动调用fsync去将AOF日志内容同步到磁盘，所以这一切就完全依赖于操作系统的调试了。对大多数Linux操作系统，是每30秒进行一次fsync，将缓存区中的数据写到磁盘上。
重写是什么，AOF采用文件追加方式，文件会越来越大为避免出现此种情况，新增了重写机制，当AOF文件的大小超过所设定的阈值时，Redis就会启动AOF文件的内容压缩，只保留可以恢复数据的最小指令集，可以使用命令bgrewriteaof。
重写原理，AOF文件持续增长而过大时，会fork出一条新进程来将文件重写(也是先写临时文件最后再rename)，遍历新进程的内存中数据，每条记录有一条的Set语句。重写aof文件的操作，并没有读取旧的aof文件，而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件，这点和快照有点类似。
重写触发机制，Redis会记录上次重写时的AOF大小，默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发。
no-appendfsync-on-rewrite:重写时是否可以运用appendfsync，用默认no即可，保证数据安全性。
auto-aof-rewrite-min-size:设置重写的基准值，大小大于多少，auto-aof-rewrite-percentage:设置重写的基准值，是上次重写的多少倍，两者同时满足时触发。
劣势：相同数据集的数据而言aof文件要远大于rdb文件，恢复速度慢于rdb，aof运行效率要慢于rdb，每秒同步策略效率较好，不同步效率和rdb相同。
aof文件是一个只进行追加的日志文件。
Redis可以在aof文件体积变得过大时，自动地在后台对aof进行重写。
aof文件有序地保存了对数据库执行的所有写入操作，这些写入操作以Redis协议的格式保存，因此aof文件的内容非常容易被人读懂，对文件进行分析也很轻松。
对于相同的数据集来说，aof文件的体积通常要大于rdb文件的体积。
根据所使用的fsync策略，aof的速度可能慢于rdb。

总结：
1.RDB持久化方式能够在指定的时间间隔能对你的数据进行快照存储。
2.AOF持久化方式记录每次对服务器写的操作，当服务器重启的时候会重新执行这些命令来恢复原始的数据，AOF命令以redis协议追加保存每次写的操作到文件末尾，Redis还能对AOF文件进行后台重写，使得AOF文件的体积不至于过大。
3.只做缓存：如果你只希望你的数据在服务器运行的时候存在，你也可以不使用任何持久化方式。
4.同时开启两种持久化方式，在这种情况下，当redis重启的时候会优先载入aof文件来恢复原始的数据，因为在通常情况下aof文件保存的数据集要比rdb文件保存的数据集要完整。rdb的数据不实时，同时使用两者时服务器重启也只会找aof文件，那要不要只使用aof呢？作者建议不要，因为rdb更适合用于备份数据库(aof在不断变化不好备份)，快速重启，而且不会有aof可能潜在的bug，留着作为一个万一的手段。

建议：
1.因为rdb文件只用作后备用途，建议只在Slave上持久化rdb文件，而且只要15分钟备份一次就够了，只保留save 900 1这条规则。
2.如果使用aof，好处是在最恶劣情况下也只会丢失不超过两秒数据，启动脚本较简单只load自己的aof文件就可以了。代价一是带来了持续的IO，二是aof rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可，应该尽量减少aof rewrite的频率，aof重写的基础大小默认值64M太小了，可以设到5G以上。默认超过原大小100%大小时重写可以改到适当的数值。
3.如果不使用aof，仅靠Master-Slave Replication实现高可用性也可以。能省掉一大笔IO也减少了rewrite时带来的系统波动。代价是如果Master/Slave同时倒掉，会丢失十几分钟的数据，启动脚本也要比较两个Master/Slave中的rdb文件，载入较新的那个，新浪微博就选用了这种架构。