Redis持久化

RDB持久化

实现类似照片记录效果的方式,就是把某一时刻的数据和状态以文件的形式写到磁盘上,也就是快照。这样一来即使故障宕机,快照文件也不会丢失,数据的可靠性也就得到了保证。这个快照文件就称为RDB文件(dump.rdb),其中,RDB就是Redis DataBase的缩写。

在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot内存快照,它恢复时再将硬盘快照文件直接读回到内存里。

Redis的数据都在内存中,保存备份时它执行的是全量快照,也就是说,把内存中的所有数据都记录到磁盘中,一锅端。

配置文件

自动触发:

Redis 6.0.16以前:

在Redis.conf 配置文件中的SNAPSHOTTING 下配置 save 参数,来触发 Redis 的 RDB 持久化条件,

比如 “ save m n” 表示在 m 秒内数据集存在 n 次修改时,自动触发 bgsave

save 900 1: 每隔900s(15min),如果有超过1个key发生了变化,就写一份新的 RDB 文件。

save 300 10:每隔300s(5min),如果有超过10个key发生了变化,就写一份新的RDB文件。

save 60 10000:每隔60(1min),如果有超过10000个key发生了变化,就写一份新的RDB文件。

Redis 6.2以及Redis7:

操作步骤自动备份:

Redis7版本,按照redis.conf 里配置的 save

本次案例5秒2次修改

修改dump文件保存路径

默认:

自定义修改的路径

且可以进入redis里用CONFIG GET dir 获取目录

修改dump文件名称

触发备份

第一种情况:

第二种情况:

如何恢复

将备份文件(dump.rdb)移动到 redis 安装目录并启动服务即可。

备份成功后故意用flushdb清空redis,看下是否可以恢复数据。

结论:执行flushall、flushdb、shutdown命令都会产生dump.rdb文件,但里面是空的,无意义。

物理恢复,一定要服务和备份 分级隔离

(不可以把备份文件dump.rdb和生产redis服务器放在同一台机器,必须分开各自存储,以防生产机物理损坏后备份文件也挂了)

手动备份

Redis提供了两个命令来生成RDB文件,分别是 savebgsave

  • save:在主程序中执行 会阻塞 当前Redis服务器,直到持久化工作完成,执行save命令期间,Redis不能处理其他命令,线上禁止使用(试试就逝世)

  • bgsave(默认):Redis会在后台异步进行快照操作,不阻塞 ,快照同时还可以响应客户端请求,该触发方式会fork一个子进程由子进程复制持久化过程。

Redis会使用bgsave对当前内存中的所有数据做快照,这个操作是子进程在后台完成的,这就允许主进程同时可以修改数据。

什么是fork?

在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,尽量避免膨胀。

  • 可以通过LASTSAVE命令获得最后一次成功执行快照的时间

优劣总结:

优势:

官网说明:

翻译:

小总结:

  • 适合大规模的数据恢复

  • 按照业务定时备份

  • 对数据完整性和一致性要求不高

  • RDB文件在内存中的加载速度要比AOF快得多

劣势:

官网说明:

小总结:

  • 在一定间隔时间做一次备份,如果Redis意外down掉的话,就会丢失从当前至最近一次快照期间的数据。

  • 内存数据的全量同步,如果数据量太大会导致I/O严重影响服务器性能。

  • RDB依赖于主进程的fork,在更大的数据集中,这可能会导致服务请求的瞬间延迟。

  • fork的时候内存中的数据被克隆了一份,几乎2倍的膨胀性,需要考虑

数据丢失案例:

录入数据:

kill掉进程:

Redis重启恢复,查看数据是否丢失:

如何检查修复dump.rdb文件

哪些情况会触发RDB快照

  1. 配置文件中默认的快照配置

  2. 手动save/bgsave命令

  3. 执行flushall/flushdb命令也会产生dump.rdb文件,但里面是空的,没意义

  4. 执行shutdown且没有设置开启AOF持久化

  5. 主从复制时,主节点自动触发

如何禁用快照

  • 动态停止所有RDB保存规则的方法(命令行):redis-cli config set save “”

  • 配置文件

RDB优化配置项详解

配置文件SNAPSHOTTING模块

  • save 多少秒内发生多少次改变进行备份

  • dbfilename 自定义dump文件的名称

  • dir 自定义dump文件保存位置

  • stop-writes-on-bgsave-error

默认yes;如果配置成no,表示你不在乎数据不一致或者有其他的手段发现和控制这种不一致,那么在快照写入失败时,也能确保redis继续接受新的写请求

  • rdbcompression

默认yes,对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis会采用LZF算法进行压缩。 如果你不想消耗CPU来进行压缩的话,可以设置为关闭此功能

  • rdbchecksum

默认yes,在存储快照后,还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能

  • rdb-del-sync-files

rdb-del-sync-files:在没有持久性的情况下删除复制中使用的RDB文件启用。默认情况下no,此选项是禁用的。

AOF持久化

以日志的形式记录每个写操作,将Redis执行过的所有写指令记录下来(读指令不记录),只许追加文件但不可改写文件,Redis启动之初会读取该文件重新构建数据,换言之,Redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

默认情况下,Redis是没有开启AOF(append only file)的。开启AOF功能需要设置配置:appendonly yes

AOF保存的是 appendonly.aof 文件

AOF持久化工作流程

  1. Client作为命令的来源,会有多个源头以及源源不断的请求命令。

  2. 在这些命令到达 Redis Server 以后并不是直接写入AOF文件,会将这些命令先放入 AOF缓存 中进行保存。这里的AOF缓冲区实际上是内存中的一片区域,存在的目的是当这些命令达到一定量以后再写入磁盘,避免频繁的磁盘IO操作。

  3. AOF缓冲会根据AOF缓冲区同步文件的 三种写回策略 将命令写入磁盘上的AOF文件。

  4. 随着写入AOF内容的增加为避免膨胀,会根据规则进行命令的合并(又称AOF重写、AOF rewrite、AOFRW),从而起到AOF文件压缩的目的。

  5. 当Redis Server 服务器重启的时候会从AOF文件载入数据。

AOF缓冲区三种写回策略

  • Always:同步写回,每个写命令执行完立刻同步的将日志写回磁盘

  • Everysec:每秒写回,每个写命令执行完,只是先把日志写到AOF文件的内存缓冲区,每隔1秒把缓冲区中的内容写入磁盘

  • no:操作系统控制的写回,每个写命令执行完,只是先把日志写到AOF文件的内存缓冲区,由操作系统决定何时将缓冲区内容写回磁盘

    总结:

    配置项写回时机优点缺点
    Always同步写回可靠性高,数据基本不丢失每个写命令都要落盘,性能影响较大
    Everysec每秒写回性能适中宕机时丢失1秒内的数据
    No操作系统控制的写回性能好宕机时丢失数据较多

配置文件开启AOF

使用默认写回策略,每秒钟 AOF文件保存路径

Redis 6:

AOF保存文件的位置和RDB保存文件的位置一样,都是通过redis.conf 配置文件的 dir 配置

Redis 7:

自定义一个appenddirname属性,如图配置AOF文件保存路径是(dir/appenddirname):/myredis/appendonlydir/XXXX.aof

AOF文件保存名称

Redis 6:有且只有一个

Redis 7:Multi Part AOF的设计

为什么要设计MP-AOF?

为了解决AOFRW存在的问题(内存、CPU、磁盘IO开销太大,代码复杂度较高)。

详情可参考:Redis 7.0 Multi Part AOF的设计和实现-阿里云开发者社区 (aliyun.com)

恢复

  1. 前提:修改默认的appendonly no 改为yes

  2. 写操作,生成AOF文件到指定的目录

  1. 正常恢复

    1. 重启Redis然后重新加载,结果OK

    2. 写入数据进Redis,备份aof文件,然后flushdb+shutdown服务器(新生成了dump和aof)

    3. 删除dump和aof再看恢复

    4. 重启Redis服务器重新加载看看

      5. 停止服务器,拿出我们的备份文件修改后再启动服务器看看

    1. 异常恢复

      1.故意乱写正常的AOF文件,模拟网络闪断文件写入error【vim /myredis/appendonlydir/appendonly.aof.1.incr.aof】

      1. 尝试重启Redis,发现启动不了,是因为Redis启动之后就会进入AOF文件的载入

      1. 异常修复命令:redis-check-aof –fix

                4. 重启OK

优劣势

优势:更好的保护数据不丢失、性能高、可做紧急恢复

劣势:相同数据集的数据而言AOF文件要远大于RDB文件,恢复速度也慢于RDB文件

AOF运行效率要慢于RDB,每秒同步策略较好,但不同步效率和RDB相同

AOF重写机制

由于AOF持久化是Redis不断将写命令记录到 AOF 文件中,随着Redis不断的进行,AOF 的文件会越来越大,文件越大,占用服务器内存越大以及 AOF 恢复要求时间越长。

为了解决这个问题,Redis新增了重写机制,当AOF文件的大小超过所设定的峰值时,Redis就会自动启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集

或者

可以手动使用命令 bgrewriteaof 来重新。

注意:是且的关系(同时满足2个条件)才会触发。

  1. 根据上次重写后的AOF大小,判断当前AOF大小是不是增长了一倍(100%)

  2. 重写时文件大小满足条件(64mb)

启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集。

举个例子:比如有个key

一开始你 set k1 v1

然后改成 set k1 v2

最后改成 set k1 v3

如果不重写,那么这3条语句都在aof文件中,内容占空间不说启动的时候都要执行一遍,共计3条命令;

但是,我们实际效果只需要set k1 v3这一条,所以,

开启重写后,只需要保存set k1 v3就可以了只需要保留最后一次修改值,相当于给aof文件瘦身减肥,性能更好。

AOF重写不仅降低了文件的占用空间,同时更小的AOF也可以更快地被Redis加载。

案例:

配置准备:

开启AOF

重写峰值改为1k

关闭混合模式

删除之前的全部AOF和rdb,清除干扰项

自动触发案例:

重写触发:

手动触发案例:

客户端向服务器发送bgrewriteaof命令

结论:

AOF文件重写并不是对原文件进行重新整理,而是直接读取服务器现有的键值对,然后用一条命令去代替之前记录这个键值对的多条命令,生成一个新的文件后去替换原来的AOF文件。

AOF文件重写触发机制:通过redis.conf 配置文件中的auto-aof-rewrite-percentage:100,以及auto-aof-rewrite-min-size:64mb 配置,也就是说默认Redis文件惠济路上次重写的AOF大小,默认配置是当AOF文件大小事上次rewrite后大小的一倍且文件大于64mb时触发

重写原理:

1:在重写开始前,redis会创建一个“重写子进程”,这个子进程会读取现有的AOF文件,并将其包含的指令进行分析压缩并写入到一个临时文件中。

2:与此同时,主进程会将新接收到的写指令一边累积到内存缓冲区中,一边继续写入到原有的AOF文件中,这样做是保证原有的AOF文件的可用性,避免在重写过程中出现意外。

3:当“重写子进程”完成重写工作后,它会给父进程发一个信号,父进程收到信号后就会将内存中缓存的写指令追加到新AOF文件中

4:当追加结束后,redis就会用新AOF文件来代替旧AOF文件,之后再有新的写指令,就都会追加到新的AOF文件中

5:重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似

AOF优化配置项

小总结:

RDB-AOF混合持久化官网说明

配置文件说明

数据恢复顺序和加载流程

在同时开启RDB和AOF持久化时,重启时只会加载AOF文件,不会加载RDB文件

二者区别

RDB持久化方式能够在指定的时间间隔对你的数据进行快照存储

AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来回复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾

同时开启两种持久化方式

在这种情况下,当Redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下,AOF文件保存的数据集要比RDB文件保存的数据集要完整。

RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件。那要不要只使用AOF呢?作者建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),留着RDB作为一个万一的手段。

推荐方式:RDB+AOF混合方式

结合了RDB和AOF的优点,技能快速加载又能避免丢失过多的数据。

开启方式:

设置 aof-use-rdb-preamble yes 表示开启,设为no表示禁用。

结论:RDB镜像做全量持久化,AOF做增量持久化

先使用RDB进行快照存储,然后使用AOF持久化记录所有写操作,当重写策略满足或手动触发重写的时候,将最新的数据存储为新的RDB记录。这样的话,重启服务的时候会从RDB和AOF两部分恢复数据,既保证了数据完整性,又提高了恢复数据的性能。简单来说:混合持久化方式产生的文件一部分是RDB格式,一部分是AOF格式。AOF包括了RDB头部+AOF混写。

纯缓存模式

同时关闭RDB+AOF

save "" :禁用rdb,禁用rdb持久化模式下,我们仍然可以使用save、bgsave命令生成rdb文件

appendonly no:禁用AOF,但我们仍然可以使用bgrewriteaof命令生成AOF文件