【Mysql】三大日志|【Mysql】三大日志 redo log、bin log、undo log

@
目录

  • redo log(物理日志\重做日志)
  • binlog(逻辑日志/归档日志)
  • update语句执行流程
  • Uodolog(回滚日志/重做日志)
    • undo log+redo log保证持久性

redo log(物理日志\重做日志)
redo log是InnoDB存储引擎层的日志,又称重做日志文件,是物理日志。redo log记录数据修改后新数据的备份、冗杂的undo log、未提交的事务和回滚的事务,数据缓存到内存中,只是在事务提交前将redo log持久化到磁盘
redo log 可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,保证了事务的持久性。
当有一条记录需要更新的时候,InnoDB引擎就会先把记录写到redo log中,并更新内存。之后,InnoDB引擎会在适当的时候,将这个操作更新到磁盘中,这个更新是在系统比较空闲的时候做,他的关键点是先写日志,再写磁盘。
redo log日志大小是固定的,若空间满了以后会回到头部停止更新,先加载一些数据到磁盘让出文件空间,之后继续写入

物理日志:因为mysql数据最终是保存在数据页中的,物理日志记录的就是数据页变更。
为了保证Redo Log能够有比较好的IO性能,InnoDB 的 Redo Log的设计有以下几个特点:
  • 尽量保持Redo Log存储在一段连续的空间上。因此在系统第一次启动时就会将日志文件的空间完全分配。以顺序追加的方式记录Redo Log,通过顺序IO来改善性能。
  • redo log包括两部分:一是内存中的日志缓冲(redo log buffer),该部分日志是易失性的;二是磁盘上的重做日志文件(redo log file),该部分日志是持久的。日志并不是直接写入文件的,而是先写入日志缓冲,当需要将日志刷新到磁盘时(如事务提交),将许多日志一起写入磁盘.
  • 并发的事务共享Redo Log的存储空间,它们的Redo Log按语句的执行顺序,依次交替的记录在一起,以减少日志占用的空间。所以,当一个事务将Redo Log写入磁盘时,也会将其他未提交**的事务的日志写入磁盘。
  • Redo Log上只进行顺序追加的操作,当一个事务需要回滚时,它的Redo Log记录也不会从Redo Log中删除掉。

注意:
一般在事务提交之前会将redo log持久化到磁盘中,以此来保证持久性


binlog(逻辑日志/归档日志)
binlog是属于MySQL Server层面的,又称为归档日志,属于逻辑日志,是以二进制的形式记录的是这个语句的原始逻辑,依靠binlog是没有CrashSafe能力的
逻辑日志:可以简单理解为记录的就是sql语句。
binlog主要使用场景:主从复制数据恢复
主从复制:在Master端开启binlog,然后将binlog发送到各个Slave端,Slave端重放binlog从而达到主从数据一致。
数据库恢复方法
系统会定期整库备份,binlog会记录所有的逻辑操作,当需要恢复到指定的某一时刻时:
  • 首先,找到最近的一次全量备份
  • 然后,从备份时间开始,将binlog依次取出来,一直重放到指定的时刻

为什么 redo log 具有 crash-safe 的能力,而 binlog 没有?
CrashSafe指MySQL服务器宕机重启后,能够保证:
- 所有已经提交的事务的数据仍然存在。
- 所有没有提交的事务的数据自动回滚。
当数据库 crash(崩溃) 后,想要恢复未刷盘但已经写入 redo log binlog 的数据到内存时,binlog 是无法恢复的。虽然 binlog 拥有全量的日志,但没有一个标志让 innoDB 判断哪些数据已经刷盘,哪些数据还没有。
redo log 不一样,只要刷入磁盘的数据,都会从 redo log 中抹掉,数据库重启后,直接把 redo log 中的数据都恢复至内存就可以了。这就是为什么 redo log 具有crash-safe的能力,而binlog 不具备。

redo log 和 binlog的区别:
  1. redo log是InnoDB特有的日志,binlog 所有引擎都可以使用
  2. redo log是物理日志,记录的是该数据页更新的内容;binlog是逻辑日志,记录的是这个更新语句的原始逻辑
  3. redo log是循环写的,空间固定会用完。binlog是可以追加写的,当binlog写到一定大小会切换到下一个,并不会覆盖以前的日志
  4. binlog可以作为恢复数据使用,主从复制搭建,redo log作为异常宕机或者介质故障后的数据恢复使用。

update语句执行流程
首先进行sql查询语句的执行流程,如需 update ID = 2 ,先找到这一行,执行以下流程:
【Mysql】三大日志|【Mysql】三大日志 redo log、bin log、undo log
文章图片

为什么update语句 要有两阶段提交?
这是为了让两份日志之间的逻辑一致。
当执行update语句时,数据修改完更新到内存,先写redo log 并设置redo log为准备阶段,再写binlog,写完binlog设置为redo log为结束阶段。两个中间有一个写入差错,那么该操作都是失败,即redo log发现只有准备阶段没有结束,那么会将该条事务进行回滚。

假如不采用两阶段提交机制的话那么会有什么影响呢?
(1)先写redo log:当写完redo log设备断电,binlog没有记录,那么数据库刚刚启动之后通过redo log可以恢复到断电前的状态,但是由于binlog没有写入,当从某个节点进行恢复时(或者创建一个备份库),那么binlog没用这条记录,恢复出来的数据库是有错误的。
(2)先写binlog:当写完binlog设备断电,redo log没有记录,还没有写入磁盘,那么数据库重新启动之后通过redo log恢复并没有这条数据,而当从某个时间点进行恢复(或者创建一个备份库)时,binlog有相关数据,所以会导致数据不统一。



Uodolog(回滚日志/重做日志)
Undo Log 是为了实现事务的原子性,事务中执行失败,进行回滚,在MySQL数据库 InnoDB 存储引擎中,还用Undo Log来实现多版本并发控制(简称:MVCC)。由引擎层的InnoDB引擎实现,是逻辑日志,记录数据修改被修改前的值。

原理:
Undo Log的原理很简单,为了满足事务的原子性,在操作任何数据之前,首先将数据备份到Undo Log。然后进行数据的修改。如果出现了错误或者用户执行了ROLLBACK语句,系统可以利用Undo Log中的备份将数据恢复到事务开始之前的状态。

回滚时机?
  • 用户调用 rollback 主动回滚
  • 事务出错
  • 辅助 redo log 实现事务持久性

当事务提交的时候,innodb不会立即删除undo log,因为后续还可能会用到undo log,如隔离级别为repeatable read时,事务读取的都是开启事务时的最新提交行版本,只要该事务不结束,该行版本就不能删除,即undo log不能删除。
但是在事务提交的时候,会将该事务对应的undo log放入到删除列表中,未来通过purge来删除。并且提交事务时,还会判断undo log分配的页是否可以重用,如果可以重用,则会分配给后面来的事务,避免为每个独立的事务分配独立的undo log页而浪费存储空间和性能。

undo log+redo log保证持久性 除了可以保证事务的原子性,Undo Log也可以用来辅助完成事务的持久化,如数据库异常之后的恢复机制。
【【Mysql】三大日志|【Mysql】三大日志 redo log、bin log、undo log】因为未提交的事务和回滚了的事务也会记录在Redo Log,因此在进行恢复时,这些事务要进行特殊的的处理。有2种不同的恢复策略:
A. 进行恢复时,只重做已经提交了的事务。
B. 进行恢复时,重做所有事务包括未提交的事务和回滚了的事务。然后通过Undo Log回滚那些未提交的事务。
MySQL数据库InnoDB存储引擎使用了B策略,InnoDB存储引擎中的恢复机制有几个特点:
  • Undo Log回滚那些未提交的事务,被回滚了的事务在恢复时先redoundo,也不会破坏数据的一致性
  • ? 必须要在写Redo Log之前将对应的Undo Log写入磁盘。为了降低复杂度,InnoDB将Undo Log看作数据,因此记录Undo Log的操作也会记录到redo log中。这样undo log就可以象数据一样缓存起来,而不用在redo log之前写入磁盘了。

参考:
极客时间 mysql45讲
https://www.qiancheng.me/post/coding/mysql-001
说说MySQL中的Redo log Undo log都在干啥 - 苏家小萝卜 - 博客园 (cnblogs.com)
详细分析MySQL事务日志(redo log和undo log) - 骏马金龙 - 博客园 (cnblogs.com)
MySQL事务日志undo log和redo log分析

    推荐阅读