当前位置: 首页 > news >正文

MySQL事务篇

MySQL事务篇
一、一条Insert语句
为了故事的顺利发展,我们需要创建一个表:

CREATE TABLE t (id INT PRIMARY KEY,c VARCHAR(100)
) Engine=InnoDB CHARSET=utf8;

然后向这个表里插入一条数据:

INSERT INTO t VALUES(1, '刘备'); 

现在表里的数据就是这样的:

mysql> SELECT * FROM t;
±—±-------+
| id | c |
±—±-------+
| 1 | 刘备 |
±—±-------+
1 row in set (0.01 sec)

二、执行流程在这里插入图片描述
三、事务回顾
MySQL 是一个服务器/客户端架构的软件,对于同一个服务器来说,可以有若干个客户端与之连接,每个客户端与服务器连接上之后,就可以称之为一个会话( Session )。我们可以同时在不同的会话里输入各种语句,这些语句可以作为事务的一部分进行处理。不同的会话可以同时发送请求,也就是说服务器可能同时在处理多个事务,这样子就会导致不同的事务可能同时访问到相同的记录。我们前边说过事务有一个特性称之为隔离性,理论上在某个事务对某个数据进行访问时,其他事务应该进行排队,当该事务提交之后,其他事务才可以继续访问这个数据。但是这样子的话对性能影响太大,所以设计数据库的程序员提出了各种隔离级别,来最大限度的提升系统并发处理事务的能力,但是这也是以牺牲一定的隔离性来达到的。事务是数据库最为重要的机制之一,凡是使用过数据库的人,都了解数据库的事务机制,也对ACID四个基本特性如数家珍。但是聊起事务或者ACID的底层实现原理,往往言之不详,不明所以。接下来我们深入分析一下事务的原理。由于在MySQL中的事务是由存储引擎实现的,而且MySQL内支持事务的存储引擎只有InnoDB。因此我们主要讲解InnoDB存储引擎中的事务。

3.1 事务四大特性ACID

数据库事务具有ACID四大特性。ACID是以下4个词的缩写:
原子性(atomicity) :事务最小工作单元,要么全成功,要么全失败 。
一致性(consistency): 事务开始和结束后,数据库的完整性不会被破坏 。
隔离性(isolation) :不同事务之间互不影响
持久性(durability) :事务提交后,对数据的修改是永久性的,即使系统故障也不会丢失 。

3.2 事务并发问题

  1. 脏读:一个事务读到了另一个事务未提交的数据
  2. 不可重复读:一个事务读到了另一个事务已经提交(update)的数据。引发另一个事务,在事务中的多次查询结果不一致。
  3. 虚读 /幻读:一个事务读到了另一个事务已经插入(insert)的数据。导致另一个事务,在事务中多次查询的结果不一致。
    3.3 隔离级别
    read uncommitted 读未提交【RU】,一个事务读到另一个事务没有提交的数据。
    存在:3个问题(脏读、不可重复读、幻读)。
    解决:0个问题
    read committed 读已提交【RC】,一个事务读到另一个事务已经提交的数据。
    存在:2个问题(不可重复读、幻读)。
    解决:1个问题(脏读)
    repeatable read:可重复读【RR】,在一个事务中读到的数据始终保持一致,无论另一个事务是否提交。
    存在:1个问题(幻读)。
    解决:2个问题(脏读、不可重复读)
    MySQL默认的事务隔离级别
    serializable 串行化,同时只能执行一个事务,相当于事务中的单线程。
    存在:0个问题。
    解决:3个问题(脏读、不可重复读、幻读)

四、事务底层原理详解

4.1 丢失更新问题
两个事务针对同一数据都发生修改操作时,会存在丢失更新的现象,这个问题称之为丢失更新问题。
举个栗子:
管理者要查询所有用户的存款总额,假设除了用户A和用户B之外,其他用户的存款总额都为0,A、B用户各有存款1000,所以所有用户的存款总额为2000。但是在查询过程中,用户A会向用户B进行转账操作。转账操作和查询总额操作的时序图如下图所示。
转账和查询的时序图:在这里插入图片描述
4.2 解决方案
4.2.1 基于锁并发控制LBCC
使用LBCC(LBCC,基于锁的并发控制Lock Based Concurrency Control)可以解决上述的问题。
查询总额事务会对读取的行加锁,等到操作结束后再释放所有行上的锁。因为用户A的存款被锁,导致转账操作被阻塞,直到查询总额事务提交并将所有锁都释放。
使用锁机制:在这里插入图片描述
这种方案比较简单粗暴,就是一个事务去读取一条数据的时候,就上锁,不允许其他事务来操作。假如当前事务只是加读锁,那么其他事务就不能有写锁,也就是不能修改数据;而假如当前事务需要加写锁,那么其他事务就不能持有任何锁。总而言之,能加锁成功,就确保了除了当前事务之外,其他事务不会对当前数据产生影响,所以自然而然的,当前事务读取到的数据就只能是最新的,而不会是快照数据。
关于锁,会在锁篇详细讲解

4.2.2 基于版本并发控制MVCC
当然使用MVCC(MVCC,多版本的并发控制,英文全称:Multi Version Concurrency Control)机制可以解决这个问题。
查询总额事务先读取了用户A的账户存款,然后转账事务会修改用户A和用户B账户存款,查询总额事务读取用户B存款时不会读取转账事务修改后的数据,而是读取本事务开始时的副本数据【快照数据】。
使用MVCC机制(RR隔离级别下的演示情况):在这里插入图片描述
MVCC使得普通的SELECT请求不会加锁,读写不冲突,提高了数据库的并发处理能力。MVCC,保证了ACID中的隔离性。MVCC是怎么实现的,接下来我们详细说明。

4.3 MVCC实现原理【InnoDB】
首先来看一下MVCC的定义:
Multiversion concurrency control (MVCC) is a concurrency control method commonly used by database management systems to provide concurrent access to the database and in programming languages to implement transactional memory.
翻译之后可知,MVCC是用于数据库提供并发访问控制的并发控制技术。是相对于LBCC更好的一种并发控制技术。MVCC核心思想是读不加锁,读写不冲突。在读多写少的OLTP应用中,读写不冲突是非常重要的,极大的增加了系统的并发性能,这也是为什么现阶段,几乎所有的RDBMS,都支持了MVCC原因。
MVCC 核心理念是数据快照,不同的事务访问不同版本的数据快照,从而实现事务的隔离级别。虽然字面上是说具有多个版本的数据快照,但这并不意味着数据库必须拷贝数据,保存多份数据文件,这样会浪费大量的存储空间。InnoDB通过事务的undo log巧妙地实现了多版本的数据快照。MVCC 在mysql 中的实现依赖的是 undo log 与 read view 。

注意MVCC只在RR和RC两个隔离级别下工作。RU和串行化隔离级别都和 MVCC不兼容 。为什么?
因为RU总是读取最新的数据行,本身就没有隔离性,也不解决并发潜在问题,因此不需要!而SERIALIZABLE则会对所有读取的行都加锁,相当于串行执行,线程之间绝对隔离,也不需要。

在这里插入图片描述
InnoDB的MVCC是通过在每行记录后面保存两个隐藏的列来实现的。这两个列,一个保存了行的事务ID,一个保存了行的回滚指针。每开始一个新的事务,都会自动递增产生一个新的事务id。事务开始时,会把事务id放到当前事务影响的行事务id中。当查询时,需要用当前查询的事务id和每行记录的事务
id进行比较。
4.3.1 undo log
为了更好的支持并发,InnoDB的多版本一致性读是采用了基于回滚段的的方式。另外,对于更新和删除操作,InnoDB并不是真正的删除原来的记录,而是设置记录的delete mark为1。因此为了解决数据Page和Undo Log膨胀的问题,需要引入回收机制进行回收。Undo log保存了记录修改前的镜像。根据行为的不同,undo log分为两种: insert undo log 和 update undo log
1)insert undo log:
是在 insert 操作中产生的 undo log。
因为 insert 操作的记录只对事务本身可见,对于其它事务此记录是不可见的,所以 insert undo log 可以在事务提交后直接删除而不需要进行回收操作。
如下图所示(初始状态):

#事务1:
Insert into user(id,name,age,address) values (10,'tom',23,'nanjing')

在这里插入图片描述
2)update undo log :
是 update 或 delete 操作中产生的 undo log。因为会对已经存在的记录产生影响,为了提供 MVCC机制,因此 update undo log 不能在事务提交时就进行删除,而是将事务提交时放到入 history list 上,等待 purge 线程进行最后的删除操作。
如下图所示(第一次修改):

#事务2:
update user set name='jack',age=10 where id=10;
#当事务2使用UPDATE语句修改该行数据时,会首先使用写锁锁定改行,将该行当前的值复制到undolog中,然后再真正地修改当前行的值,最后填写事务ID,使用回滚指针指向undo log中修改前的行。

在这里插入图片描述
当事务3进行修改与事务2的处理过程类似,如下图所示(第二次修改):

#事务3:
update user set name='Lucy',age=11 where id=10;

在这里插入图片描述
为了保证事务并发操作时,在写各自的undo log时不产生冲突,InnoDB采用回滚段的方式来维护undolog的并发写入和持久化。回滚段实际上是一种 Undo 文件组织方式,是多个版本数据的链表,也称之为版本链了。
4.3.2 ReadView

MVCC的核心问题就是:判断一下版本链中的哪个版本是当前事务可见的!
对于使用 RU 隔离级别的事务来说,直接读取记录的最新版本就好了,不需要Undo log。
对于使用 串行化 隔离级别的事务来说,使用加锁的方式来访问记录,不需要Undo log。
对于使用 RC 和 RR 隔离级别的事务来说,需要用到undo log的版本链。
1)什么是ReadView?
所以设计 InnoDB 的设计者提出了一个ReadView的概念。结合Undo log的默认字段【事务db_trx_id】来控制那个版本的undo log可被用户看见。这个 ReadView 中主要包含当前系统中还有哪些活跃的读写事务,把它们的事务id放到一个列表中,我们把这个列表命名为为m_ids,并确定三个变量的值:
m_up_limit_id:事务id下限,m_ids事务列表中的最小事务id。
m_low_limit_id:事务id上限,系统中将要产生的下一个事务id的值。
m_creator_trx_id:当前事务id,m_ids中不包含当前事务id。
2)ReadView怎么产生,什么时候生成?
开启事务之后,在第一次查询(select)时,生成ReadView
RC 和 RR 隔离级别的的一个非常大的区别就是它们生成 ReadView 的时机不同
RC 和 RR 隔离级别的差异本质是因为MVCC中ReadView的生成时机不同,详情在案例中分析。
3)如何判断可见性?
在访问某条记录时,按照下边步骤判断记录的版本链的某个版本是否可见:
循环判断规则如下:被访问undo log版本的事务id与ReadView的关系->
&小于ReadView中的 m_up_limit_id ,表明生成该版本的事务在生成ReadView 前已经提交,所以该版本可以被当前事务访问。
&等于ReadView中的 m_creator_trx_id ,可以被访问。
&大于等于ReadView中的 m_low_limit_id ,在生成 ReadView 后才生成,所以该版本不可以被当前事务访问。
&在 m_up_limit_id 和 m_low_limit_id 之间,那就需要判断是不是在 m_ids 列表中。
&&如果在,说明创建 ReadView 时生成该版本的事务还是活跃的,该版本不可以被访问;
&&如果不在,说明创建 ReadView 时生成该版本的事务已经被提交,该版本可以被访问。
循环判断Undo log中的版本链某一的版本是否对当前事务可见,如果循环到最后一个版本也不可见的
话,那么就意味着该条记录对该事务不可见,查询结果就不包含该记录。

4)ReadView案例分析

-- 开启事务:还有一种方式begin
start transaction
-- 提交事务:
commit
-- 回滚事务:
rollback
-- 查询事务隔离级别:
select @@tx_isolation;
-- 设置数据库的隔离级别
set session transaction isolation level read committed
-- 级别字符串:`read uncommitted`、`read committed`、`repeatable read【默认】`、
`serializable`
-- 查看当前运行的事务
SELECTa.trx_id,a.trx_state,a.trx_started,a.trx_query,b.ID,b.USER,b.DB,b.COMMAND,b.TIME,b.STATE,b.INFO,c.PROCESSLIST_USER,c.PROCESSLIST_HOST,c.PROCESSLIST_DB,  d.SQL_TEXT
FROMinformation_schema.INNODB_TRX a
LEFT JOIN information_schema.PROCESSLIST b ON a.trx_mysql_thread_id = b.id
AND b.COMMAND = 'Sleep'
LEFT JOIN PERFORMANCE_SCHEMA.threads c ON b.id = c.PROCESSLIST_ID
LEFT JOIN PERFORMANCE_SCHEMA.events_statements_current d ON d.THREAD_ID =
c.THREAD_ID;
  1. 读已提交RC案例
    每次读取数据前都生成一个ReadView,默认t表中只有一条数据,数据内容是刘备。
>时间事务01【db_trx_id=100】事务02【db_trx_id=200】事务03【db_trx_id=300】
T1开启事务开启事务开启事务
T2更新为关羽
T3更新为张飞
T4更新为赵云
T5更新为诸葛亮
T6查询id=1,c为刘备
T7提交事务01
T8查询id=1,c为张飞
T9提交事务02
T10查询id=1,c为诸葛亮

Tips: 事务id是递增的
T3时刻,表 t 中 id 为 1 的记录得到的版本链表如下所示:在这里插入图片描述

这个 SELECT01 的执行过程如下:
在执行 SELECT 语句时会先生成一个 ReadView , m_ids 列表的内容就是 [100, 200] 。然后从版本链中挑选可见的记录,从图中可以看出最新版本的列 c 的内容是 ‘张飞’ ,该版本的 trx_id 值为 100 ,在 m_ids 列表内,所以不符合可见性要求,跳下一个版本。下一个版本的列 c 的内容是 ‘关羽’ ,该版本的 trx_id 值也为 100 ,也在 m_ids 列表内,所以也不符合要求,跳下一个版本。下一个版本的列 c 的内容是 ‘刘备’ ,该版本的 trx_id 值为 80 ,小于 m_ids 列表中最小的事务id 100 ,此版符合要求.最后返回给用户的版本就是这条列 c 为 ‘刘备’ 的记录。
T5时刻,表 t 中 id 为 1 的记录的版本链就长这样:
在这里插入图片描述
这个 SELECT02 的执行过程如下:
在执行 SELECT 语句时会先生成一个 ReadView , ReadView 的 m_ids 列表的内容就是 [200]事务id为 100 的那个事务已经提交了,所以生成快照时就没有它了然后从版本链中挑选可见的记录,从图中可以看出最新版本的列 c 的内容是 ‘诸葛亮’ ,该版本的 trx_id 值为 200 ,在 m_ids 列表内,不符合
可见性要求,跳下一个版本下一个版本的列 c 的内容是 ‘赵云’ ,该版本的 trx_id 值为 200 ,也在 m_ids 列表内,不符合要求,跳下一个版本.下一个版本的列 c 的内容是 ‘张飞’ ,该版本的 trx_id 值为 100 ,比 m_ids 列表中最小的事务id 200 还要小,此版符合要求最后返回给用户的版本就是这条列 c 为 ‘张飞’ 的记录。以此类推,如果之后事务id为 200 的记录也提交了,再此在使用 RC 隔离级别的事务中查询表 t 中 id 值为 1 的记录时,得到的结果就是 ‘诸葛亮’ 了,具体流程我们就不分析了。
总结:使用RC隔离级别的事务在每次查询开始时都会生成一个独立的ReadView。

案例代码如下:

# 事务01
-- 查询事务隔离级别:
select @@tx_isolation;
-- 设置数据库的隔离级别
set session transaction isolation level read committed;
SELECT * FROM t; # 默认是刘备
# Transaction 100
BEGIN;
UPDATE t SET c = '关羽' WHERE id = 1;
UPDATE t SET c = '张飞' WHERE id = 1;
COMMIT;
# 事务02
-- 查询事务隔离级别:
select @@tx_isolation;
-- 设置数据库的隔离级别
set session transaction isolation level read committed;
# Transaction 200
BEGIN;
# 更新了一些别的表的记录
...
UPDATE t SET c = '赵云' WHERE id = 1;
UPDATE t SET c = '诸葛亮' WHERE id = 1;
COMMIT;
# 事务03
-- 查询事务隔离级别:
select @@tx_isolation;
-- 设置数据库的隔离级别
set session transaction isolation level read committed;
BEGIN;
# SELECT01:Transaction 100、200未提交
SELECT * FROM t WHERE id = 1; # 得到的列c的值为'刘备'
# SELECT02:Transaction 100提交,Transaction 200未提交
SELECT * FROM t WHERE id = 1; # 得到的列c的值为'张飞'
# SELECT03:Transaction 100、200提交
SELECT * FROM t WHERE id = 1; # 得到的列c的值为'诸葛亮'
COMMIT;
  1. 可重复读RR案例
    在事务开始后第一次读取数据时生成一个ReadView。对于使用 RR 隔离级别的事务来说,只会在第一次执行查询语句时生成一个 ReadView ,之后的查询就不会重复生成了。我们还是用例子看一下是什么效果。
    代码与执行流程与RC案例完全相同,唯一不同的是事务隔离级别。
    T3时刻,表 t 中 id 为 1 的记录得到的版本链表如下所示:在这里插入图片描述
    这个 SELECT1 的执行过程如下:
    在执行 SELECT 语句时会先生成一个 ReadView , ReadView 的 m_ids 列表的内容就是 [100,200] 。然后从版本链中挑选可见的记录,从图中可以看出,最新版本的列 c 的内容是 ‘张飞’ ,该版本的 trx_id 值为 100 ,在 m_ids 列表内,不符合可见性要求,跳下一个版本。下一个版本的列 c 的内容是 ‘关羽’ ,该版本的 trx_id 值也为 100 ,也在 m_ids 列表内,不符合要求,跳下一个版本。下一个版本的列 c 的内容是 ‘刘备’ ,该版本的 trx_id 值为 80 ,小于 m_ids 列表中最小的事务id 100 ,版本符合要求
    最后返回给用户的版本就是这条列 c 为 ‘刘备’ 的记录。
    T5时刻,表 t 中 id 为 1 的记录的版本链就长这样:在这里插入图片描述
    这个 SELECT2 的执行过程如下:

因为之前已经生成过 ReadView 了,所以此时直接复用之前的 ReadView ,之前的 ReadView 中的m_ids 列表就是 [100, 200] 。
然后从版本链中挑选可见的记录,从图中可以看出:
最新版本的列 c 的内容是 ‘诸葛亮’ ,该版本的 trx_id 值为 200 ,在 m_ids 列表内,不符合可见性要求,跳下一个版本
下一个版本的列 c 的内容是 ‘赵云’ ,该版本的 trx_id 值为 200 ,也在 m_ids 列表内,不符合要求,跳下一个版本
下一个版本的列 c 的内容是 ‘张飞’ ,该版本的 trx_id 值为 100 ,也在 m_ids 列表内,不符合要求,跳下一个版本
下一个版本的列 c 的内容是 ‘关羽’ ,该版本的 trx_id 值为 100 ,也在 m_ids 列表内,不符合要求,跳下一个版本
下一个版本的列 c 的内容是 ‘刘备’ ,该版本的 trx_id 值为 80 , 80 小于 m_ids 列表中最小的事务id 100 ,版本符合要求
最后返回给用户的版本就是这条列 c 为 ‘刘备’ 的记录。
也就是说两次 SELECT 查询得到的结果是重复的,记录的列 c 值都是 ‘刘备’ ,这就是 可重复读 的含义。如果我们之后再把事务id为 200 的记录提交了,之后再到刚才使用 REPEATABLE READ 隔离级别的事务中继续查找这个id为 1 的记录,得到的结果还是 ‘刘备’ ,具体执行过程大家可以自己分析一下。

4.4 MVCC下的读操作
在一个支持MVCC并发控制的系统中,哪些读操作是快照读?哪些操作又是当前读呢?

在MVCC并发控制中,读操作可以分成两类:快照读 (snapshot read)与当前读 (current read)。
快照读:读取的是记录的可见版本 (有可能是历史版本),不用加锁。刚才案例中都是快照读。
当前读:读取的是记录的最新版本,并且当前读返回的记录,都会加上锁,保证其他事务不会再并发修改这条记录。

4.4.1 当前读
以MySQL InnoDB为例:
快照读:简单的select操作,属于快照读,不加锁。

select * from table where ?; 

当前读:特殊的读操作,插入/更新/删除操作,属于当前读,需要加锁。

select * from table where ? lock in share mode; # 加读锁
select * from table where ? for update;# 加写锁
insert into table values ();# 加写锁
update table set ? where ?;# 加写锁
delete from table where ?;# 加写锁
# 所有以上的语句,都属于当前读,读取记录的最新版本。并且,读取之后,还需要保证其他并发
事务不能修改当前记录,对读取记录加锁。其中,除了第一条语句,对读取记录加**读锁**外,其
他的操作都加的是**写锁**

在这里插入图片描述
从图中,可以看到,一个Update操作的具体流程。
当Update SQL被发给MySQL后,MySQL Server会根据where条件,读取第一条满足条件的记录,然后InnoDB引擎会将第一条记录返回,并加锁 (current read)。待MySQL Server收到这条加锁的记录之后,会再发起一个Update请求,更新这条记录。一条记录操作完成,再读取下一条记录,直至没有满足条件的记录为止。因此,Update操作内部,就包含了一个当前读。
同理,Delete操作也一样。Insert操作会稍微有些不同,简单来说,就是Insert操作可能会触发UniqueKey的冲突检查,也会进行一个当前读。
注:根据上图的交互,针对一条当前读的SQL语句,InnoDB与MySQL Server的交互,是一条一条进行的,因此,加锁也是一条一条进行的。先对一条满足条件的记录加锁,返回给MySQL Server,做一些DML操作;然后在读取下一条加锁,直至读取完毕。
案例代码:

BEGIN;
# SELECT1:Transaction 100、200未提交
SELECT * FROM t WHERE id = 1; # 得到的列c的值为'刘备'
# SELECT2:Transaction 100提交,Transaction 200未提交
SELECT * FROM t WHERE id = 1; # 得到的列c的值为'张飞'
select * from t where id=1 lock in share mode; # 当前读
COMMIT;

4.4.2 快照读
快照读也就是一致性非锁定读(consistent nonlocking read)是指InnoDB存储引擎通过多版本控制(MVCC)读取当前数据库中行数据的方式。如果读取的行正在执行DELETE或UPDATE操作,这时读取操作不会因此去等待行上锁的释放。相反地,InnoDB会去读取行的一个最新可见快照。
ReadView的读取操作就是快照读;
4.5 小结
MVCC指在使用RC、RR隔离级别下,使不同事务的 读-写 、 写-读 操作并发执行,提升系统性能MVCC核心思想是读不加锁,读写不冲突。RC、RR这两个隔离级别的一个很大不同就是生成 ReadView 的时机不同:RC在每一次进行普通 SELECT 操作前都会生成一个 ReadView ,RR在第一次进行普通 SELECT 操作前生成一个 ReadView ,之后的查询操作都重复这个ReadView 。

五、事务回滚与数据恢复
正常情况下,事务如何回滚数据?
异常情况下,如何回滚数据?
事务的隔离性由MVCC和锁实现。
事务的原子性,持久性和一致性主要是通过redo log、undo log和Force Log at Commit机制机制来完成的。
Force Log at Commit机制保证事务提交后redo log日志都已经持久化。
undo log用于对事务的影响进行撤销,也可用于多版本控制。
redo log用于在崩溃时恢复数据,事务回滚和数据恢复是如何实现的呢?
redo log的原理:
redo log顾名思义,就是重做日志,每次数据库的SQL操作导致的数据变化它都会记录一下,具体来说,redo log是物理日志,记录的是数据库页的物理修改操作。如果数据发生了丢失,数据库可以根据redo log进行数据恢复。
InnoDB通过Force Log at Commit机制实现事务的持久性,即当事务COMMIT时,必须先将该事务
的所有日志都写入到redo log文件进行持久化之后,COMMIT操作才算完成。
当事务的各种SQL操作执行时,即会在缓冲区中修改数据,也会将对应的redo log写入它所属的缓存。当事务执行COMMIT时,与该事务相关的redo log缓冲必须都全部刷新到磁盘中之后COMMIT才算执行成功。
数据回滚与恢复流程:
开启一个事务后,用户可以使用COMMIT来提交,也可以用ROLLBACK来回滚。
其中COMMIT或者ROLLBACK执行成功之后,数据一定是会被全部保存或者全部回滚到最初状态的,这也体现了事务的原子性。
但是也会有很多的异常情况,比如说事务执行中途连接断开,或者是执行COMMIT或者ROLLBACK时发生错误,Server Crash等,此时数据库会自动进行回滚或者重启之后进行恢复。
回滚与恢复流程如下:
在这里插入图片描述
数据库崩溃重启后需要从redo log中把未落盘的脏页数据恢复出来,重新写入磁盘,保证用户的数据不丢失。当然,在崩溃恢复中还需要回滚没有提交的事务。由于回滚操作需要undo log的支持,undo log的完整性和可靠性需要redo log来保证,所以崩溃恢复先做redo恢复数据,然后做undo回滚。在事务执行的过程中,除了记录redo log,还会记录一定量的undo log。undo log记录了数据在每个操作前的状态,如果事务执行过程中需要回滚,就可以根据undo log进行回滚操作。undo log的存储不同于redo log,它存放在数据库内部的一个特殊的段(segment)中,这个段称为回滚段。回滚段位于共享表空间中。undo段中以undo page为更小的组织单位。undo page和存储数据库数据索引的页类似。因为redo log是物理日志,记录的是数据库页的物理修改操作。所以undo log(也看成数据库数据)的写入也会产生redo log,也就是undo log的产生会伴随着redo log的产生,这是因为undo log也需要持久性的保护。事务进行过程中,每次DML sql语句执行,都会记录undo log和redo log,然后更新数据形成脏页,然后redo log按照时间或者空间等条件进行落盘,undo log和脏页按照checkpoint进行落盘,落盘后相应的redo log就可以删除了。此时,事务还未COMMIT,如果发生崩溃,则首先检查checkpoint记录,使用相应的redo log进行数据和undo log的恢复,然后查看undo log的状态发现事务尚未提交,然后就使用undo log进行事务回滚。事务执行COMMIT操作时,会将本事务相关的所有redo log都进行落盘,只有所有redo log落盘成功,才算COMMIT成功。然后内存中的数据脏页继续按照checkpoint进行落盘。如果此时发生了崩溃,则使用redo log恢复数据。

相关文章:

MySQL事务篇

MySQL事务篇 一、一条Insert语句 为了故事的顺利发展,我们需要创建一个表: CREATE TABLE t (id INT PRIMARY KEY,c VARCHAR(100) ) EngineInnoDB CHARSETutf8;然后向这个表里插入一条数据: INSERT INTO t VALUES(1, 刘备); 现在表里的数据就…...

【Redis】搭建分片集群

目录 集群结构 准备实例和配置 启动 创建集群 测试 集群结构 分片集群需要的节点数量较多,这里我们搭建一个最小的分片集群,包含3个master节点,每个 master包含一个slave节点,结构如下: 这里我们会在同一台虚…...

RoCEv2网络部署实践

延续上篇RoCE网络的介绍,我们知道承载ROCEv2流量必须有一张无损网络。 本章主要介绍在以太网环境部署无损网络的关键点。 首先是QoS,包含流分类和队列调度两部分。 流分类:在网络接入设备(TOR)配置if-match类的语句&am…...

【HashMap】| 深度剥析Java SE 源码合集Ⅱ | 你会吗?

目录一. 🦁 HashMap介绍1.1 特点1.2 底层实现二. 🦁 结构以及对应方法分析2.1 结构组成2.1.1 成员变量2.1.2 存储元素的节点类型2.1.2.1 链表Node类2.1.2.2 树节点类2.1.2.3 继承关系2.2 方法实现2.2.1 HashMap的数组初始化2.2.2 计算hash值2.2.3 添加元…...

剑指 Offer 39. 数组中出现次数超过一半的数字

剑指 Offer 39. 数组中出现次数超过一半的数字 难度:easy\color{Green}{easy}easy 题目描述 数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。 你可以假设数组是非空的,并且给定的数组总是存在多数元素。 示例 1: 输入: …...

使用python控制摄像头

前言 当今,随着计算机技术的发展,摄像头已经成为了人们生活中不可或缺的一部分。而Python作为一种流行的编程语言,也可以轻松地控制和操作摄像头。无论你是想用Python写一个简单的摄像头应用程序,还是想在机器学习和计算机视觉项…...

Linux文件系统

目录 1、常见的linux文件系统 2、文件系统的组成 inode的内容: 可以用stat命令,查看某个文件的inode信息 inode的大小 inode号码 使用 ls -i来查看文件的inode号码 使用 df -i命令,查看每个硬盘分区的inode总数和已经使用的数量&#xff…...

扬帆优配|引活水 增活力 促转型 创业板助力实体经济高质量发展

立异就是生产力,企业赖之以强,国家赖之以盛。全面注册制变革持续开释立异生机。日前,创业板公司已开端连续公布2022年度年度报告和2023年第一季度成绩预告,从频频传来的“喜报”中可窥见立异驱动开展战略下新兴工业的强劲开展态势…...

【c++】:STL模板中string的使用

文章目录 STL简介一.认识string二.string中基本功能的使用总结STL简介 STL(standard template libaray-标准模板库):是C标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架。STL的版本 原始版本 Alexand…...

华为OD机试用Python实现 -【连续字母长度 or 求第 K 长的字符串长度】 | 2023.Q1 A卷

华为OD机试题 本篇题目:连续字母长度 or 求第 K 长的字符串长度题目输入描述输出描述示例一输入输出说明示例二输入输出说明示例三输入输出说明Code代码编写逻辑最近更新的博客 华为od 2023 | 什么是华为od,od...

前端处理并发的最佳实践

什么是并发? 因为js是单线程的,所以前端的并发指的是在极短时间内发送多个数据请求,比如说循环中发送ajax。 举一个简单的例子: 下面一段代码是常规的mount阶段执行的请求: useEffect(async () > {console.time…...

【SOP 】配电网故障重构方法研究【IEEE33节点】(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...

[MySQL索引]4.索引的底层原理(三)

索引的底层原理(三)哈希索引InnoDB自适应哈希索引哈希索引 memory存储引擎支持的是哈希索引,memory是支持内存的存储引擎。 哈希表中的元素没有任何顺序可言,只能进行等值比较,包括范围搜索、前缀搜索like、order by…...

2023金三银四应届生求职面试指南

一、应届生优势 划重点,一定要走校招;千万不要等毕业之后再想着找工作,在毕业前就要敲定落实;否则,就真的该焦虑了。要知道应届生的身份是一个很吃香的身份;只有应届生可以走校园招聘。 1、那校园招聘跟社会招聘有多大的差距?? 这么说吧&…...

【数据结构】解决顺序表题的基本方法

🚀write in front🚀 📜所属专栏:> 初阶数据结构 🛰️博客主页:睿睿的博客主页 🛰️代码仓库:🎉VS2022_C语言仓库 🎡您的点赞、关注、收藏、评论&#xff0…...

HDFS如何解决海量数据存储及解决方案详解

HDFS组件 HDFS组件的基准测试 说明 一般在搭建完集群之后,运维人员需要对集群进行压力测试,对于HDFS来讲,主要是读写测试写入测试 hadoop jar /export/server/hadoop-3.3.0/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.…...

认识CSS值如何提高写前端代码的效率

🌟所属专栏:前端只因变凤凰之路🐔作者简介:rchjr——五带信管菜只因一枚😮前言:该系列将持续更新前端的相关学习笔记,欢迎和我一样的小白订阅,一起学习共同进步~👉文章简…...

MySQL知识点全面总结3:Mysql高级篇

三.MySQL知识点全面总结3:mysql高级篇 1.mysql语句的执行过程? 2.myesql事务详解? 3.mysql日志详解? 4.mysql的索引功能详解? 5.mysql的存储引擎详解? 6.mysql事务提交后数据与硬盘如何交互存储&…...

Spring注解开发之组件注册(二)

Spring注解开发之组件注册(一) 5.Import 给容器导入一个组件 给容器中注册组件 一、包扫描 组件标注注解(Controller/Service/Repository/Component) [自己写的类] 二、Bean [导入的第三包里面的组件] 三、Import [快速给容器中导入组件] (Import{…...

【web前端开发】CSS最常用的11种选择器

文章目录1.CSS介绍2.CSS的语言规则3.CSS的引入方式4.选择器标签选择器类选择器id选择器通配符选择器复合选择器后代选择器子代选择器并集选择器交集选择器伪类选择器hover伪类选择器active伪类选择器结构伪类选择器结语1.CSS介绍 CSS (Cascading Style Sheets,层叠样…...

微电影广告发展的痛点

微电影广告以不可阻挡之势进入大众生活中,企业利用微电影广告来进行企业形象塑造的例子比比皆是。于是乎,微电影广告在为企业塑造品牌形象方面上取得了可喜的效果,但也不可忽视,在这个发展过程中,微电影广告所面临的问…...

uniapp新手入门

前言: 这篇文章主要写的是uniapp的基础知识,可以让大家快速上手uniapp,同时避掉一些可能踩到的坑。 一. 什么是uniapp uniapp是由dcloud 公司开发的多端融合框架。uniapp的出现让我们的开发更为方便,一次开发,多端运行…...

linux segfault at 问题定位实践

问题:程序崩溃,打印为:app[13016]: segfault at 7fb668d29930 ip 00007fb668d3c23c sp 00007fb668e7de20 error 7 in mydefine.so[7fb668d3400011000]定位步骤:基础分析数据,大概了解反馈信息(根据chatGPT&…...

SpringCloud+SpringCloudAlibaba

架构的演进1.1单体架构将所有业务场景的表示层、业务逻辑层和数据访问层放在一个工程中,最终经过编译、打包,部署在一台服务器上。◆ 1.1.1单体架构的优点1)部署简单: 由于是完整的结构体,可以直接部署在一个服务器上即可。2&…...

华为OD机试 - 路灯照明(C 语言解题)【独家】

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南)华为od机试,独家整理 已参加机试人员的实战技巧文章目录 使用说明本期题目:路灯照明…...

Linux程序替换

Linux程序替换创建子进程的目的?程序替换如何实现程序替换?什么是程序替换?先见一见单进程版本的程序替换程序替换原理多进程版本的程序替换execl函数组简易版Shell创建子进程的目的? 目的:为了帮助父进程完成一些特定的任务&…...

@JsonFormat @DataTimeFormat 时间格式

省流:用JsonFormat即可有时候会看到入参dto里,在时间类型的变量上用DateTimeFormat,代码如下。public class XXXdto{DateTimeFormat(pattern "yyyy-MM-dd hh:mm:ss")private Date startDate; }这是为了入参传日期格式的值。即前端…...

带你玩转modbusTCP通信

modbus TCP Modbus TCP是一种基于TCP/IP协议的Modbus通信协议,它是Modbus协议的一种变体,用于在以太网上进行通信。Modbus TCP协议是一种开放的通信协议,它支持多种编程语言和操作系统,并且可以在不同的硬件和软件平台上进行通信…...

2021牛客OI赛前集训营-提高组(第三场)T2交替

2021牛客OI赛前集训营-提高组(第三场) 题目大意 一个长度为nnn的数组aaa,每秒都会变成一个长度为n−1n-1n−1的新数组a′aa′,其变化规则如下 如果当前数组aaa的大小nnn为偶数,则对于新数组a′aa′的每一个位置i(1≤…...

论文投稿指南——中文核心期刊推荐(金融)

【前言】 🚀 想发论文怎么办?手把手教你论文如何投稿!那么,首先要搞懂投稿目标——论文期刊 🎄 在期刊论文的分布中,存在一种普遍现象:即对于某一特定的学科或专业来说,少数期刊所含…...