Redis数据持久化

2020-03-22

Redis的所有数据都在内存中，断电后将全部丢失。数据的持久化功能就是为了解决这一问题。

Redis提供了RDB、AOF以及RDB-AOF混合模式。

RDB

RDB全称为Redis Database，是Redis默认的持久化方案。这种方式是在某个触发点生成这一时刻的数据库的一个数据快照，存储为.rdb为后缀名的一个二进制文件。

方式及其命令

阻塞式

save

执行save命令，Redis服务器进入阻塞状态，无法为其他客户端提供服务。RDB文件创建成功之后将旧文件替换掉。

非阻塞式

bgsave

bgsave命令不会阻塞服务器，而是创建一个子进程，子进程执行save命令，创建成功后子进程退出并通知父进程新RDB文件已完成，Redis服务器进程将旧文件替换掉。

但是由于这一操作要创建子进程，所以父进程占用的内存越大，则创建子进程耗时越长，因此执行此命令时，仍然有可能因为创建子进程导致短暂的阻塞。

在配置文件中的save配置，服务器自动执行的就是bgsave命令。

命令选择

那么在手动执行时如何决定使用哪个方式呢？

save在执行时会阻塞整个服务器，索引如果因为备份的同时为其他客户端提供服务，就应该使用bgsave。

save执行时不需要创建子进程，在不需要提供服务时，可以使用save命令。

数据丢失

save命令是阻塞的方式，它的开始和结束是一个原子操作。所以这种方式在停机时丢失的是在最后一次成功执行save命令之后产生的所有数据。

bgsave的开始和结束是异步的。所以这种采用这种方式，在停机时丢失的是最后一次成功执行bgsave命令的开始时间。

RDB文件结构

RDB文件标识符
版本号
设备附加信息
数据
Lua脚本缓存
EOF
CRC64校验和

文件标识符

文件的开头部分，为REDIS这 5 个字符，在载入RDB文件的时候会通过这个标识符快速判断是否为RDB文件。

版本号

一个长度为 4 个字符的字符串格式的数字，如0009，第 9 版。文件的读取版本向下兼容。

设备信息

记录了Redis服务器及所在平台的信息，诸如服务器版本号、宿主机架构，创建RDB文件的时间戳、服务器占用的内存数量等。

数据

记录了 0 到多个数据库的数据，按数据库的号码从小到大。

每一个数据的数据结构为：

数据库号码
键值对总数
带有过期时间的键值对数量
键值对数据部分

载入的时候，首先根据数据库号码切换到指定的数据库。

然后服务器会根据第 2 部分和第 3 部分创建优化数据库的数据结构。

最后的键值对数据中，每一个键值对最多被划分为 5 个部分：

过期时间
LRU信息
LFU信息
类型
键
值

LRU与LFU只会出现一个，因为Redis只能选择一种淘汰策略。

`Lua`脚本缓存

如果Redis启动了复制功能，那么服务器将在这里保存所有已被缓存的Lua脚本。

EOF

用于标记RDB文件正文内容的末尾，它的值为二进制0XFF。当服务器读到这里的时候就知道正文部分结束了。

`CRC64`校验和

一个无符号 64 位整数。通过它来检验文件是否损坏。

载入`RDB`文件

graph TB
    A(打开文件)
    B[检查文件标识符]
    C[检查版本号]
    D[读取设备信息]
    E[重建数据库]
    F[重建脚本缓存]
    G[对比校验和]
    H[载入完毕]

    A-->B
    B-->C
    C-->D
    D-->E
    E-->F
    F-->G
    G-->H

缺陷

创建RDB文件的时间间隔决定了发生问题时丢失的数据量成正比。save或者bgsave创建RDB文件是存储整个服务器包含的所有数据，频繁的执行这个操作必然影响计算资源性能，不可能以减小操作间隔的方式来保障数据安全。

AOF

AOF的全称为append only file。

它是将数据库操作命令增量的保存到一个文件中。

缺陷

因为AOF文件存储的是命令的Redis网络协议格式的文本，所以其体积要比同数据量的RDB文件要大。
在恢复数据时，RDB是直接恢复，而AOF要执行命令，所以RDB的恢复效率更高。
AOF重写的bgrewriteaof命令也需要创建子进程，在数据库体积较大的情况下进行AOF重写将占用大量资源，并短暂阻塞。

graph TB
    A(载入AOF文件)
    B{命令截断选项}
    C[执行命令]
    D[失败]
    E[成功]

    A-->B
    B--no-->D
    B--yes-->C
    C-->E

AOF 与 RDB 混合持久化

1	aof-use-rdb-preamble < yes \| no >

通过这个选项来开启RDB与AOF混合持久化。

这个选项开启后，在进行AOF重写时，就会像进行bgsave那样，将当前的数据快照生成相应的RDB数据，但是这时不会生成RDB文件，而是将生成的RDB数据内容添加到AOF文件中（也就是生成了新的AOF文件，但是内容是RDB数据）。

之后redis执行的命令会也会以网络协议文本的形式继续添加到现有的AOF文件末尾。

所以在开启了这个选项之后，生成的AOF文件包含两个部分

RDB数据部分
AOF命令协议文本部分

恢复数据时的载入逻辑：

判断文件开头是否包含RDB数据，如包含则先载入RDB数据再载入之后的AOF
若只包含AOF数据，那么服务器将直接载入AOF数据

graph TB
    A[打开AOF文件]
    B{是否包含RDB数据}
    C(载入RDB数据)
    D(载入AOF数据)
    E[数据载入完毕]

    A-->B
    B--yes-->C
    B--no-->D
    C-->D
    D-->E

孙十一

Redis数据持久化

RDB

相关配置

方式及其命令

阻塞式

非阻塞式

命令选择

数据丢失

RDB文件结构

文件标识符

版本号

设备信息

数据

`Lua`脚本缓存

EOF

`CRC64`校验和

载入`RDB`文件

缺陷

AOF

相关配置

相关命令

缺陷

AOF 与 RDB 混合持久化

RDB

相关配置

方式及其命令

阻塞式

非阻塞式

命令选择

数据丢失

RDB文件结构

文件标识符

版本号

设备信息

数据

Lua脚本缓存

EOF

CRC64校验和

载入RDB文件

缺陷

AOF

相关配置

相关命令

缺陷

AOF 与 RDB 混合持久化

`Lua`脚本缓存

`CRC64`校验和

载入`RDB`文件