mysql|mysql MVCC事务实现原理
作者:朱庆林
大家知道MySQL中的事务是基于MVCC版本链实现的,但是MySQL对于我们来说是一个黑盒,对于底层的实现了解的不是很多。本文主要介绍MySQL中的InnoDB引擎的MVCC的实现原理,由浅到深带领大家从根上理解MySQL
InnoDB行格式
InnoDB存储引擎中记录是以行的形式存储的,这就意味着数据页(page)中保存的是一行行的数据,我们把记录在磁盘上的存放方式被称为行格式或者记录格式。到目前为止设计了4种不同类型的行格式,分别为Compact、Redundant、Dynamic和Compressed。本文只简单的介绍Compact行格式(其他的行格式大同小异,暂不做介绍)。可以通过下列命令修改、查看行格式
## 创建表设置行格式
CREATE TABLE 表名 (列的信息) ROW_FORMAT=行格式名称## 修改行格式
ALTER TABLE 表名 ROW_FORMAT=行格式名称##查看表行格式
SHOW TABLE STATUS LIKE "表名"
COMPACT行格式
文章图片
上图为compact行格式的结构示意图,其中跟事务(MVCC)有关联的是隐藏列的内容
变长字段长度列表 mysql支持一些变长字段类型比如:VARCHAR、TEXT、BLOB等。变长字段中存储多少字节的数据是不固定的,所以我们在存储真实数据的时候需要顺便把这些数据占用的字节数也存起来。
null值列表 表中的某些列可能存储NULL值,如果把这些NULL值都放到记录的真实数据中存储会很占地方,所以Compact行格式把这些值为NULL的列统一管理起来,存储到NULL值列表
记录头信息
文章图片
隐藏列
名称 | 描述 |
---|---|
row_id | 列id(如果表没有指定主键,该列为隐藏主键) |
trx_id | 事务id |
roll_pointer | 回滚指针、指向undo日志 |
- READ UNCOMMITTED:未提交读。
- READ COMMITTED:已提交读。
- REPEATABLE READ:可重复读。
- SERIALIZABLE:可串行化。
事务隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
READ UNCOMMITTED | 是 | 是 | 是 |
READ COMMITTED | 否 | 是 | 是 |
REPEATABLE READ | 否 | 否 | 是 |
REPEATABLE READ | 否 | 否 | 否 |
版本链 上面介绍过行格式中有个隐藏的列(row_id,trx_id,roll_pointer),其中row_id不是必须的。
- trx_id:每次一个事务对某条聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id隐藏列。
- roll_pointer:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
备注: 事务执行过程中,只有在第一次真正修改记录时(比如使用INSERT、DELETE、UPDATE语句),才会被分配一个单独的事务id,这个事务id是递增的当前有个hero的表,查询结果下图:
文章图片
假设插入该记录的事务id为80,那么此刻该条记录的示意图如下所示
文章图片
之后两个事务id分别为100、200的事务对这条记录进行UPDATE操作,操作流程如下:
事务trx_id 100 | 事务trx_id 200 |
---|---|
begin | |
begin | |
UPDATE hero set name="关羽" | |
UPDATE hero set name="张飞" | |
commit | |
UPDATE hero set name="赵云" | |
UPDATE hero set name="诸葛亮" | |
commit |
文章图片
ReadView
对于使用READ UNCOMMITTED隔离级别的事务来说,由于可以读到未提交事务修改过的记录,所以直接读取记录的最新版本就好了;对于使用SERIALIZABLE隔离级别的事务来说,规定使用加锁的方式来访问记录;对于使用READ COMMITTED和REPEATABLE READ隔离级别的事务来说,都必须保证读到已经提交了的事务修改过的记录,也就是说假如另一个事务已经修改了记录但是尚未提交,是不能直接读取最新版本的记录的,核心问题就是:需要判断一下版本链中的哪个版本是当前事务可见的。为此mysql设计出了ReadView的概念,ReadView中有4个比较重要的属性:
- m_ids:表示在生成ReadView时当前系统中活跃的读写事务的事务id列表。
- min_trx_id:表示在生成ReadView时当前系统中活跃的读写事务中最小的事务id,也就是m_ids中的最小值。
- max_trx_id:表示生成ReadView时系统中应该分配给下一个事务的id值。
- creator_trx_id:表示生成该ReadView的事务的事务id。
- 如果被访问版本的trx_id属性值与ReadView中的creator_trx_id值相同,意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。
- 如果被访问版本的trx_id属性值小于ReadView中的min_trx_id值,表明生成该版本的事务在当前事务生成ReadView前已经提交,所以该版本可以被当前事务访问。
- 如果被访问版本的trx_id属性值大于或等于ReadView中的max_trx_id值,表明生成该版本的事务在当前事务生成ReadView后才开启,所以该版本不可以被当前事务访问。
- 如果被访问版本的trx_id属性值在ReadView的min_trx_id和max_trx_id之间,那就需要判断一下trx_id属性值是不是在m_ids列表中,如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问;如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问。
- READ COMMITTED —— 每次读取数据前都生成一个ReadView
- READ COMMITTED —— 在第一次读取数据时生成一个ReadView
MySQL是怎样运行的
【mysql|mysql MVCC事务实现原理】
文章图片
推荐阅读
- py连接mysql
- 2019-01-18Mysql中主机名的问题
- MySql数据库备份与恢复
- mysql|InnoDB数据页结构
- mysql中视图事务索引与权限管理
- MYSQL主从同步的实现
- MySQL数据库的基本操作
- javaweb|基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
- Python3|Python3 MySQL 数据库连接
- MySQL|MySQL 存储过程语法及实例