当前位置: 首页 > news >正文

Redis持久化(RDB/AOF)

"在哪里走散,你都会 找 到 我。" 


认识持久化

        我们在接触Mysql事务的时候,一定了解过Mysql事务的四个特性:
        "原子性(A)一致性(C)隔离性(I)持久性(D)"

        而其中持久性其实与持久化是一回事,所谓持久与不持久,针对的是数据。如果将该数据存储在磁盘上,那么数据就具有持久性,反之如果数据仅仅存在于内存上,就不具有持久性。

redis持久化:

        对于Redis而言,是一个内存数据库,操作的数据大都是内存级别的(Redis相比于Mysql明显优势和 特点)。但在内存存储数据是不持久的,一旦断电内存中的数据就会被清空,要想持有持久化的特性,数据必须存储在磁盘上。

        所以,既要保证速度快,那么数据的操作一定还是在内存,但如果要保证持久化,数据还是得想办法存储在磁盘上。Redis决定全都要!

        可是内存与硬盘上存储的数据只是存在理论上的一致性,实际中可能存在一定的偏差,这同我们选择的 "持久化策略" 是息息相关的。 

内存 or 硬盘?

        也许你就会有疑问,如果此时要想redis插入或者获取一个数据,是在内存、是硬盘上操作呢?

         当要插入一个数据时,就需要把这个数据同时写入内存、硬盘之中的!但说是这样说,何时写入硬盘,效率咋样,都是同我们选择的策略有关的。

        如果是要查询一个数据,直接选择从内存中读取即可。硬盘数据仅仅是在redis进入重启时,用来恢复原来内存中数据的。  


Redis持久化策略

        严格来说redis中的持久化策略有两种:

● RDB -- Redis DataBase

● AOF -- Append Only File

        其中你可以把RDB策略理解为一种"定期备份",它一定带来的一个问题是实际内存值与备份值可能存在偏差。AOF策略可以理解为一种“实时备份”。

(1) RDB简介

        RDB持久化就是将当前进程中的数据,定期写入到磁盘中,生成所谓的“快照”,也是Redis默认的持久化机制。

触发方式:        

● 手动触发        

        程序猿通过redis客户端执行特定的命令,触发生成快照。

save: 执行save命令时,会导致redis全力以赴生成“快照”,因为redis采用的是单线程模型,此时就会阻塞redis处理其他客户端的命令。(出现类似keys*的后果,一般不建议使用save)。

bgsave: 不会影响redis处理其他客户端的命令。但,redis咋做到不需要多线程完成并发编程的?答案是这里使用的是多进程模型,来处理并发编程。

● 自动触发  

        在Redis配置文件中设置了让Redis,每隔多长时间生成\每产生多少次修改,就会触发生成快照。

RDB文件

        redis的配置文件通常会在/etc目录下的redis.conf文件。        

        我们打开redis.conf文件后,可以找到redis生成的rdb文件是存放在redis的工作目录中的,这个是可以在redis中进行配置的。 

        我们进入这个路径就可以看到这文件名为 "dump.rdb"的文件。        

        当我们打开这个文件时,我们会发现是一堆乱码。        

        dump.rdb本质是一个二进制文件,是将内存中的数据,以压缩的形式保存在这个二进制文件之中的。我们一定不要拿着vim,将把这个rdb文件里的内容进行乱改。因为redis每次重启都会尝试加载这个rdb文件,如果发现这个文件格式是错误的,数据加载也会出现错误。        

        当然,我们认为不去修改并不是唯一可能导致rdb文件出现损坏的情况,当把rdb文件进行网络传输,仍然可能造成内容缺失,引起文件破坏,此时可能导致redis服务器无法启动。        

        redis还提供了rdb文件检查工具~                                

RDB触发流程        

        当执行生成rdb文件镜像时,此时会先将要生成的快照数据保存在一个临时文件之中。当这个快照生成完毕后,会删除之前的rdb文件,并把这个临时文件重命名为dump.rdb,因此从始至终都只有一份rdb文件。        

 

rdb触发时机      

        rdb文件的数据,不会根据你简简单单插入一些数据就会发生更改。其原因就在于没有触发RDB机制。

自动触发:      

        在前些段落提到过rdb有两种触发机制,分别是自动和手动触发。自动触发机制主要是在配置文件中,需要去手动进行修改。        

        当然,这些值不能设置得过小,导致频繁触发生产快照,而每一次快照生成的成本也不是可以忽略的。正因为不能频繁生成快照,所以rdb文件里的数据与实时数据可能会存在偏差。

        甚至,如果redis服务器直接挂掉(例如使用kill命令等)。会导致在上一个快照版本,与服务器崩掉前期间的数据都丢掉了!这不是rdb能够解决的问题。

 
手动触发:

        手动执行命令save\bgsave,因为咱们的数据量是很少的,所以一旦执行这两个命令中的其中一个都会很快的产生结果。感受子进程创建的过程,对我们来说比较奢望,但是检查生成的新文件,对我们而言却十分容易。

        Linux文件系统是基于ext4的组织方式,将文件系统分为三大组成部分:
▪ 超级块:放的是一些管理内容。

▪ inode区: 存放inode节点,每一个文件都有唯一的inode数据结构进行对应。

▪ block区:存放文件的数据内容。

        所以,判断一个文件是否被替换,就检查它的inode即可。        

 

RDB的优缺点

• RDB是⼀个紧凑压缩的⼆进制⽂件,代表Redis在某个时间点上的数据快照。

• Redis加载RDB恢复数据远远快于AOF的⽅式。RDB使用二进制的方式来组织数据,直接把数据读取到内存中来,按照字节格式取出来即可。但是AOF是用文本方式来组织数据,需要一系列的字符串切分操作。

• RDB⽅式数据没办法做到实时持久化/秒级持久化。因为bgsave每次运⾏都要执⾏fork创建⼦进程,属于重量级操作,频繁执⾏成本过⾼。

• RDB⽂件使⽤特定⼆进制格式保存,Redis版本演进过程中有多个RDB版本,兼容性可能有⻛
险。

        当然RDB最大的问题还是在于,无法实时持久化保存数据,在两次快照之间,如果服务器出现差错,数据会出现丢失。

(2) AOF简介

        AOF(AppendOnlyFile)持久化:以独⽴⽇志的⽅式记录每次写的命令,重启时再重新执⾏AOF⽂件中的命令达到恢复数据的⽬的。        

        “AOF的主要作⽤是解决了RDB数据无法持久化的问题”。

使用AOF

        因为redis默认使用将RDB作为默认的持久化机制,开启AOF功能需要设置配置:

        该appendonly.aof文件同rdb文件一样,存在于工作目录。

AOF文件        

        AOF本质上是一个文本文件,可以类似于Mysql中的binlog,记录用户的一系列操作。其中会用到一些特殊符号作为分隔符。

        

AOF触发流程

▪ 手动触发:

        调⽤bgrewriteaof命令

▪ 自动触发:

        根据auto-aof-rewrite-min-size和auto-aof-rewrite-percentage参数确定⾃动触发时
机。

auto-aof-rewrite-percentage:代表当前AOF占⽤⼤⼩相⽐较上次重写时增加的⽐例.

auto-aof-rewrite-min-size:表⽰触发重写时AOF的最⼩⽂件⼤⼩,默认为64MB.

AOF介入

        对于RDB而言,生成的快照只是对当前内存中数据的一份镜像,它一定存在数据不具有实时性的问题。由此,引入AOF后,既需要对内存进行写入,又需要对磁盘进行写入,才能保证数据的实时性。这会产生一个问题:

AOF策略是否会严重影响到Redis处理请求的速度?

        答案是否定的!

        AOF的工作机制并非把工作线程的数据直接就写在磁盘上,而是会在内存中开辟空间,用作缓冲区,在积累了一波后,才会向硬盘统一写入这一份数据。     

        硬盘内容的读取是根据磁头寻址的方式,如果内容数据是随机地址,那么查询花费的时间是很高的,效率也是低下的。相反,如果是顺序写入,磁头的读取效率是比随机读取要高很多的(虽然仍比不过内存的读取速度)。

        AOF是把每次新的操作写入到原文件的末尾,这是顺序写入。        

AOF策略

        将数据写入在内存开辟的缓冲区中,其数据存储还是在内存中的,一旦断电、或者崩溃这些数据还是会发生丢失!这是不可避免的!

        redis为程序猿给出了一些选项,也就是一些刷新策略(缓冲区)。

        

可配置项说明
always命令写入aof_buf后,调用fsync同步,完成后返回
everysec命令写入aof_buf后,只执行write操作,不进行fsync。由同步线程每秒进行fsync
no命令只执行aof_buf,由OS控制fsync频率

        我们谈到访问外设速率,并不强调访问或读取速度,而是次数。

▪ 当刷新频率越高,对性能影响越大,同时数据的可靠性越高。

▪ 当刷新频率越低,对性能影响越小,同时数据的可靠性越低。

AOF重写机制

        随着命令不断写⼊AOF,⽂件会越来越⼤。

        较⼩的AOF⽂件⼀⽅⾯降低了硬盘空间占⽤,⼀⽅⾯可以提升启动Redis时数据恢复的速度。

AOF重写流程                              

● 如果当前进程正在执⾏AOF重写,又接收到AOF请求直接返回。如果是当前进程正在执⾏bgsave(RDB)操作,重写命令延迟到bgsave完成之后再执⾏。

● ⽗进程执⾏fork创建⼦进程。

● 重写

        1.主进程fork之后,继续响应其他命令。所有修改操作写⼊AOF缓冲区并据appendfsync策略同步到硬盘,保证旧AOF⽂件机制正确。 如果重写中断,能够恢复出原数据。

        2.⼦进程只有fork之前的所有内存信息,⽗进程中需要将fork之后这段时间的修改操作写⼊
AOF重写缓冲区中。从而保证数据的实时性。

● ⼦进程根据内存快照,将命令合并到新的AOF⽂件中。

● ⼦进程完成重写

        1.新⽂件写⼊后,⼦进程发送信号给⽗进程。

        2.⽗进程把AOF重写缓冲区内临时保存的命令追加到新AOF⽂件中。

        3. ⽤新AOF⽂件替换⽼AOF⽂件。

(3) 混合持久化

        顾名思义,混合持久化要做的既是要保证实时性,又得保证效率。结合aof和rdb的特点。

        按照aof的方式,对每一个请求、操作都记录到文件里,触发aof重写后,就会把内存的当前状态形成快照,按照rdb的存储格式写入到aof新文件里。后续再进行操作,会按照aof文本的方式追加到文件后面。

 


 

AOF vs RDB

        当redis启动时,会根据aof或者rdb文件进行数据恢复。但,如果两者文件都存在,那么redis会如何选择呢?             

        rdb对于fork之前的数据会进行备份,但对于fork之后的数据则会置之不理,不会关心之后的任何数据。而对于aof,关心fork之前的数据意外,还能通过aof_rewrite_buf换从化区获取fork之后新数据。

        rdb本身的设计理念是“定期备份”,而aof设计的理念在于“实时备份”。


● RDB视为内存的快照,产⽣的内容更为紧凑,占⽤空间较⼩,恢复时速度更快。但产⽣RDB的开销较⼤,不适合进⾏实时持久化,⼀般⽤于冷备和主从复制。

● AOF视为对修改命令保存,在恢复时需要重放命令,持久性安全性高。并且有重写机制来定期压缩AOF⽂件。但其加载速度是不及RDB的。

● RDB和AOF都使⽤fork创建⼦进程,利⽤Linux⼦进程拥有⽗进程内存快照的特点进⾏持久化,尽可能不影响主进程继续处理后续命令。
 


本篇到此结束,感谢你的阅读。

祝你好运,向阳而生~


        

相关文章:

Redis持久化(RDB/AOF)

"在哪里走散,你都会 找 到 我。" 认识持久化 我们在接触Mysql事务的时候,一定了解过Mysql事务的四个特性: "原子性(A)一致性(C)隔离性(I)持久性(D)" 而其中持久性其实与持久化是一回事,所谓持久与不持久&#x…...

小谈设计模式(15)—观察者模式

小谈设计模式(15)—观察者模式 专栏介绍专栏地址专栏介绍 观察者模式核心思想主要角色Subject(被观察者)ConcreteSubject(具体被观察者)Observer(观察者)ConcreteObserver&#xff0…...

简单工厂模式 创建型模式(非GoF经典设计模式)

简单工厂模式是属于创建型模式,也因为工厂中的方法一般设置为静态,又叫做静态工厂方法(Static Factory Method)模式,但不属于23种GOF设计模式之一。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工…...

PE文件之导入表

1. 导入表 2. 显示导入表信息的例子 ; 作用: 将RVA地址转成FOA即文件偏移 ; 参数: _pFileHdr 指向读到内存中文件的基址指针 ; _dwRVA 目标RVA地址 ; 返回: 目标RVA转成文件偏移的值 RVA2FOA PROC USES esi edi edx, _pFileHdr:PTR BYTE, _dwRVA:DWORDmov esi, _pFil…...

二、码制及其转换

原码 根据我们所学可知,数字电路的逻辑电路是通过输出0和1来表示二进制数的,那么这个二进制数的正负又该怎么表示呢? 答案是在这个二进制数的最高位作为符号位来表示正负性,用0正数,用1表示负数,在这种表达…...

在pycharm中出现下载软件包失败的解决方法

一. 一般情况下我们会选择在设置中下载软件包,过程如下. 1. 直接点击左上角的文件, 再点击设置, 再点击项目, 在右边选择python解释器,点击号,输入要下载的软件包, 在下面的一系列的包中选择相对应的包,点击安装就可以了,有的时候我们下载的是最新的版本,如果要下载固定的版本…...

10.0 探索API调试事件原理

本章笔者将通过Windows平台下自带的调试API接口实现对特定进程的动态转存功能,首先简单介绍一下关于调试事件的相关信息,调试事件的建立需要依赖于DEBUG_EVENT这个特有的数据结构,该结构用于向调试器报告调试事件。当一个程序发生异常事件或者…...

文心一言 VS 讯飞星火 VS chatgpt (104)-- 算法导论10.1 2题

二、用go语言,说明如何在一个数组 A[1…n]中实现两个栈,使得当两个栈的元素个数之和不为 n 时,两者都不会发生上溢。要求 PUSH 和 POP 操作的运行时间为 O(1)。 文心一言: 在这个问题中,我们要在一个数组 A[1…n] 中…...

检测防火墙是否开启、判断程序是否加入防火墙白名单(附源码)

VC常用功能开发汇总(专栏文章列表,欢迎订阅,持续更新...)https://blog.csdn.net/chenlycly/article/details/124272585C软件异常排查从入门到精通系列教程(专栏文章列表,欢迎订阅,持续更新...&a…...

vtk 动画入门 1 代码

实现效果如图&#xff1a; #include <vtkAutoInit.h> //VTK_MODULE_INIT(vtkRenderingOpenGL2); //VTK_MODULE_INIT(vtkInteractionStyle); VTK_MODULE_INIT(vtkRenderingOpenGL2); VTK_MODULE_INIT(vtkInteractionStyle); //VTK_MODULE_INIT(vtkRenderingFreeType); #in…...

【VR】【unity】如何在VR中实现远程投屏功能?

【背景】 目前主流的VD应用,用于娱乐很棒,但是用于工作还是无法效率地操作键鼠。用虚拟键盘工作则显然是不现实的。为了让自己的头显能够起到小面积代替多显示屏的作用,自己动手开发投屏VR应用。 【思路】 先实现C#的投屏应用。研究如何将C#投屏应用用Unity 3D项目转写。…...

OpenGl材质

在现实世界里,每个物体会对光产生不同的反应。比如,钢制物体看起来通常会比陶土花瓶更闪闪发光,一个木头箱子也不会与一个钢制箱子反射同样程度的光。有些物体反射光的时候不会有太多的散射(Scatter),因而产生较小的高光点,而有些物体则会散射很多,产生一个有着更大半径的…...

背包问题

目录 开端 01背包问题 AcWing 01背包问题 Luogu P2925干草出售 Luogu P1048采药 完全背包问题 AcWing 完全背包问题 Luogu P1853投资的最大效益 多重背包问题 AcWing 多重背包问题 I AcWing 多重背包问题 II Luogu P1776宝物筛选 混合背包问题 AcWing 混合背包问题…...

JavaSE | 初始Java(十一) | 抽象类和抽象接口

抽象类概念 在面向对象的概念中&#xff0c;所有的对象都是通过类来描绘的&#xff0c;但是反过来&#xff0c;并不是所有的类都是用来描绘对象的&#xff0c; 如果 一个类中没有包含足够的信息来描绘一个具体的对象&#xff0c;这样的类就是抽象类 在 Java 中&#xff0c;一个…...

产品经理如何科学的进行需求调研?

导语&#xff1a;作为产品经理&#xff0c;需求调研是开展工作的重要环节之一。科学、有效地进行需求调研不仅可以帮助产品经理更好地了解用户需求&#xff0c;还能指导产品设计和功能开发&#xff0c;提升产品的竞争力。本文将介绍几种科学的方法和技巧&#xff0c;帮助产品经…...

AI智能问答系统源码/AI绘画商业系统/支持GPT联网提问/支持Midjourney绘画

一、AI创作系统 SparkAi创作系统是基于国外很火的ChatGPT进行开发的AI智能问答系统和AI绘画系统。本期针对源码系统整体测试下来非常完美&#xff0c;可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT&#xff1f;小编这里写一个详细图…...

玩具玩偶配送经营商城小程序的作用是什么?

玩具玩偶是小孩子们喜欢的产品&#xff0c;其市场需求度很高&#xff0c;以前玩具店里总是不缺乏客户&#xff0c;但现在随着人们生活品牌提升及消费形式改变&#xff0c;无论玩具厂商还是门店经销商都面对着不少痛点&#xff1a; 如拓客引流难、线上销售经营难、营销难、分销…...

latex表格内容换行

问题描述&#xff1a; 在用latex表格中编写公式时&#xff0c;可能出现公式太长&#xff0c;表格中后面的内容不能在文档中呈现&#xff0c;如下图1&#xff0c;故要进行行内内容的换行&#xff0c;使内容呈现完全而传统的\换行后,换行内容会顶格&#xff0c;如图2。 解决方…...

2023 牛客国庆day4 【10.2训练补题】

目录 B-Basic Gcd Problem&#xff08;素数筛快速幂&#xff09; H-Harder Gcd Problem&#xff08;素数&#xff09; B-Basic Gcd Problem&#xff08;素数筛快速幂&#xff09; 打表找规律发现答案为 (n质因子数目)^c #include<bits/stdc.h> using namespace std;…...

android的USB开发时 mUsbManager.getDeviceList()获取都为空

类提供的主要方法有&#xff1a; getDeviceList() 获得设备列表&#xff0c;返回的是一个HashMap.;hasPermission(UsbDevice device) 判断你的应用程序是否有接入此USB设备的权限&#xff0c;如果有则返回真&#xff0c;否则返回false.openDevice(UsbDevice device) 打开USB设…...

AI-调查研究-01-正念冥想有用吗?对健康的影响及科学指南

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; &#x1f680; AI篇持续更新中&#xff01;&#xff08;长期更新&#xff09; 目前2025年06月05日更新到&#xff1a; AI炼丹日志-28 - Aud…...

多模态2025:技术路线“神仙打架”,视频生成冲上云霄

文&#xff5c;魏琳华 编&#xff5c;王一粟 一场大会&#xff0c;聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中&#xff0c;汇集了学界、创业公司和大厂等三方的热门选手&#xff0c;关于多模态的集中讨论达到了前所未有的热度。其中&#xff0c;…...

pam_env.so模块配置解析

在PAM&#xff08;Pluggable Authentication Modules&#xff09;配置中&#xff0c; /etc/pam.d/su 文件相关配置含义如下&#xff1a; 配置解析 auth required pam_env.so1. 字段分解 字段值说明模块类型auth认证类模块&#xff0c;负责验证用户身份&am…...

蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练

前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1)&#xff1a;从基础到实战的深度解析-CSDN博客&#xff0c;但实际面试中&#xff0c;企业更关注候选人对复杂场景的应对能力&#xff08;如多设备并发扫描、低功耗与高发现率的平衡&#xff09;和前沿技术的…...

智能仓储的未来:自动化、AI与数据分析如何重塑物流中心

当仓库学会“思考”&#xff0c;物流的终极形态正在诞生 想象这样的场景&#xff1a; 凌晨3点&#xff0c;某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径&#xff1b;AI视觉系统在0.1秒内扫描包裹信息&#xff1b;数字孪生平台正模拟次日峰值流量压力…...

智能分布式爬虫的数据处理流水线优化:基于深度强化学习的数据质量控制

在数字化浪潮席卷全球的今天&#xff0c;数据已成为企业和研究机构的核心资产。智能分布式爬虫作为高效的数据采集工具&#xff0c;在大规模数据获取中发挥着关键作用。然而&#xff0c;传统的数据处理流水线在面对复杂多变的网络环境和海量异构数据时&#xff0c;常出现数据质…...

初探Service服务发现机制

1.Service简介 Service是将运行在一组Pod上的应用程序发布为网络服务的抽象方法。 主要功能&#xff1a;服务发现和负载均衡。 Service类型的包括ClusterIP类型、NodePort类型、LoadBalancer类型、ExternalName类型 2.Endpoints简介 Endpoints是一种Kubernetes资源&#xf…...

日常一水C

多态 言简意赅&#xff1a;就是一个对象面对同一事件时做出的不同反应 而之前的继承中说过&#xff0c;当子类和父类的函数名相同时&#xff0c;会隐藏父类的同名函数转而调用子类的同名函数&#xff0c;如果要调用父类的同名函数&#xff0c;那么就需要对父类进行引用&#…...

GraphQL 实战篇:Apollo Client 配置与缓存

GraphQL 实战篇&#xff1a;Apollo Client 配置与缓存 上一篇&#xff1a;GraphQL 入门篇&#xff1a;基础查询语法 依旧和上一篇的笔记一样&#xff0c;主实操&#xff0c;没啥过多的细节讲解&#xff0c;代码具体在&#xff1a; https://github.com/GoldenaArcher/graphql…...

深入理解 React 样式方案

React 的样式方案较多,在应用开发初期,开发者需要根据项目业务具体情况选择对应样式方案。React 样式方案主要有: 1. 内联样式 2. module css 3. css in js 4. tailwind css 这些方案中,均有各自的优势和缺点。 1. 方案优劣势 1. 内联样式: 简单直观,适合动态样式和…...