Mysql笔记1基础和日志

基础架构 结构
Server层

  • 包括连接器,查询缓存,分析器,优化器,执行器等
  • 涵盖Mysql大多数核心服务功能,和所有内置函数(日期,时间,数学,加密等)
  • 实现所有跨存储引擎的功能(存储过程,触发器,视图等)
存储引擎层
  • 负责数据的存储和提取
  • 架构模式是插件式的,从Mysql5.5.5开始InnoDB成为默认存储引擎
1.连接器
连接Mysql
mysql -h$ip -P$port -u$user -p

一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置。
空闲连接
连接完成后,如果你没有后续的动作,这个连接就处于空闲状态
show processlist

  • Command 列显示为“Sleep”的这一行,就表示现在系统里面有一个空闲连接。
  • 客户端如果太长时间没动静,连接器就会自动将它断开。这个时间是由参数 wait_timeout 控制的,默认值是 8 小时。
短连接
短连接则是指每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。
长连接(推荐)
长连接是指连接成功后,如果客户端持续有请求,则一直使用同一个连接。
MySQL 在执行过程中临时使用的内存是管理在连接对象里面的。这些资源会在连接断开的时候才释放。如果长连接累积下来,可能导致内存占用太大,被系统强行杀掉(OOM),从现象看就是 MySQL 异常重启了。
解决办法:
  1. 定期断开长连接。使用一段时间,或者程序里面判断执行过一个占用内存的大查询后,断开连接,之后要查询再重连。
  2. MySQL 5.7 或更新版本,可以在每次执行一个比较大的操作后,通过执行 mysql_reset_connection 来重新初始化连接资源。这个过程不需要重连和重新做权限验证,但是会将连接恢复到刚刚创建完时的状态。
2.查询缓存(Mysql8.0已删除)
  • MySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。
  • MySQL之前执行过的语句及其结果可能会以 key-value 对的形式,被直接缓存在内存中。
  • 查询缓存的失效非常频繁,只要有对一个表的更新,这个表上所有的查询缓存都会被清空。
  • 可以将参数 query_cache_type 设置成 DEMAND,这样对于默认的 SQL 语句都不使用查询缓存。
强制查询缓存语句
select SQL_CACHE * from T where ID=10;

3.分析器
分析器先会做“词法分析”。你输入的是由多个字符串和空格组成的一条 SQL 语句,MySQL 需要识别出里面的字符串分别是什么,代表什么。
如果没有命中查询缓存,就要开始真正执行语句了。
语法错误提醒:ERROR 1064 (42000): You have an error in your SQL syntax;
4.优化器
优化器是在表里面有多个索引的时候,决定使用哪个索引;或者在一个语句有多表关联(join)的时候,决定各个表的连接顺序。
5.执行器
  • 开始执行的时候,要先判断一下有没有执行权限,如果没有,就会返回没有权限的错误
  • 如果有权限,就继续执行,执行器会根据表的引擎定义,去使用这个引擎提供的接口。
示例:
mysql> select * from T where ID=10;

执行流程:
  1. 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 10,如果不是则跳过,如果是则将这行存在结果集中;
  2. 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
  3. 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
数据库的慢查询日志中有一个rows_examined字段,表示这个语句执行过程中扫描了多少行。这个值就是在执行器每次调用引擎获取数据行的时候累加的。
小结
问题:如果表 T 中没有字段 k,而你执行了这个语句 select * from T where k=1, 那肯定是会报“不存在这个列”的错误: “Unknown column ‘k’ in ‘where clause’”。你觉得这个错误是在我们上面提到的哪个阶段报出来的呢?
答案:分析器。Oracle会在分析阶段判断语句是否正确,表是否存在,列是否存在等。
其他答案:预处理器。
解析器处理语法和解析查询, 生成一课对应的解析树。
预处理器进一步检查解析树的合法。比如: 数据表和数据列是否存在, 别名是否有歧义等。如果通过则生成新的解析树,再提交给优化器。
日志系统 重做日志 redo log
redo log 是 InnoDB引擎所特有的
1)作为WAL的一种实现,在断电的情况下实现原子性和持久性;
2)将对数据库操作的随机IO转换为顺序IO,已经通过组提交的方式提高mysql的IO效率。
WAL技术
WAL 的全称是 Write-Ahead Logging,它的关键点就是先写redo log到log buffer(顺序,只寻址一次),再择机写入redo日志文件(寻址多次)。
  1. 当有一条记录需要更新的时候,InnoDB 引擎就会先把记录写到 redo log里面,并更新内存,这个时候更新就算完成了。同时,InnoDB 引擎会在适当的时候,将这个操作记录更新到磁盘里。
  2. redo log 大小固定,是循环写的,空间固定会用完;binlog 是可以追加写入的。“追加写”是指 binlog 文件写到一定大小后会切换到下一个,并不会覆盖以前的日志。
    • write pos 当前记录的位置
    • checkpoint 当前要擦除的位置
  3. 有了 redo log,InnoDB 就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,这个能力称为 crash-safe。
归档日志 binlog
binlog(归档日志)是Server 层的日志
  1. redo log 是 InnoDB 引擎特有的;binlog 是 MySQL 的 Server 层实现的,所有引擎都可以使用。
  2. redo log 是物理日志,记录的是“在某个数据页上做了什么修改”;binlog 是逻辑日志,记录的是这个语句的原始逻辑,比如“给 ID=2 这一行的 c 字段加 1 ”。
    redolog事务内每执行一条就会写入一条;binlog是在事务提交后一次性写入。
  3. redo log 是循环写的,空间固定会用完;binlog 是可以追加写入的。“追加写”是指 binlog 文件写到一定大小后会切换到下一个,并不会覆盖以前的日志。
update执行流程
语句执行时,server层调用引擎的更新接口,引擎在更新后,会写redolog,此时处于redolog的prepare阶段。然后server层写入binlog日志后,可以调用引擎的事务提交接口,由引擎把redo log改为提交状态。
update T set c=c+1 where ID=2;

  1. 执行器先找引擎取 ID=2 这一行。ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2 这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。
  2. 执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的一行数据,再调用引擎接口写入这行新数据。
  3. 引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。
  4. 执行器生成这个操作的 binlog,并把 binlog 写入磁盘。
  5. 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成。
两阶段提交
redo log 的写入拆成了两个步骤:prepare 和 commit,这就是"两阶段提交"。
数据库恢复
通过定期的整库备份加上binlog的操作回放可以保证数据的安全性。
  1. 找到最近的一次全量备份,从这个备份恢复到临时库;
  2. 从备份的时间点开始,将备份的 binlog 依次取出来,重放到中午误删表之前的那个时刻。
【Mysql笔记1基础和日志】备份实现:https://www.cnblogs.com/shamo...
异常情况(crash)
  1. 先写 redo log 后写 binlog。假设在 redo log 写完,binlog 还没有写完的时候,MySQL 进程异常重启。由于我们前面说过的,redo log 写完之后,系统即使崩溃,仍然能够把数据恢复回来,所以恢复后这一行 c 的值是 1。但是由于 binlog 没写完就 crash 了,这时候 binlog 里面就没有记录这个语句。因此,之后备份日志的时候,存起来的 binlog 里面就没有这条语句。然后你会发现,如果需要用这个 binlog 来恢复临时库的话,由于这个语句的 binlog 丢失,这个临时库就会少了这一次更新,恢复出来的这一行 c 的值就是 0,与原库的值不同。
  2. 先写 binlog 后写 redo log。如果在 binlog 写完之后 crash,由于 redo log 还没写,崩溃恢复以后这个事务无效,所以这一行 c 的值是 0。但是 binlog 里面已经记录了“把 c 从 0 改成 1”这个日志。所以,在之后用 binlog 来恢复的时候就多了一个事务出来,恢复出来的这一行 c 的值就是 1,与原库的值不同。
小结
  1. redo是物理日志,binlog是逻辑日志;
  2. redo log 用于保证 crash-safe 能力。innodb_flush_log_at_trx_commit 这个参数设置成 1 的时候,表示每次事务的 redo log 都直接持久化到磁盘。这个参数我建议你设置成 1,这样可以保证 MySQL 异常重启之后数据不丢失。
  3. sync_binlog 这个参数设置成 1 的时候,表示每次事务的 binlog 都持久化到磁盘。这个参数我也建议你设置成 1,这样可以保证 MySQL 异常重启之后 binlog 不丢失。
  4. Binlog有两种模式,statement 格式的话是记sql语句, row格式会记录行的内容,记两条,更新前和更新后都有,但是日志会变大。推荐使用row格式。

    推荐阅读