[MySQL] MySQL redolog undolog binlog
Contents
MySQL redolog undolog binlog
ySQL中有六种日志文件,分别是: 重做日志(redo log)、回滚日志(undo log)、二进制日志(binlog)、错误日志(errorlog)、慢查询日志(slow query log)、 一般查询日志(general log),中继日志(relay log)
MySQL更新数据的基础流程 图片来源:(https://juejin.cn/post/6914930251663409159)
redo log
确保事务的持久性。 防止在发生故障的时间点,尚有脏页未写入磁盘,在重启mysql服务的时候,根据redo log进行重做,从而达到事务的持久性这一特性。 redo log是InnoDB引擎层实现的,让InnoDB具备carsh-safe的能力。
redo log是物理格式的日志,记录的是物理数据页面的修改的信息,其是顺序写入redo log file的物理文件中去的。 相对于直接把数据写磁盘来说性能更高,因为直接写数据是随机写入, redo log是固定大小的,当写到结尾时会覆盖从头循环写入。
事务开始之后就产生redo log,redo log的落盘并不是随着事务的提交才写入的,而是在事务的执行过程中,便开始写入redo log文件中。
当对应事务的脏页写入到磁盘之后,redo log的使命也就完成了,重做日志占用的空间就可以重用(被覆盖)。
默认情况下,对应的物理文件位于数据库的data目录下的ib_logfile1&ib_logfile2
innodb_log_group_home_dir 指定日志文件组所在的路径,默认./ ,表示在数据库的数据目录下。
innodb_log_files_in_group 指定重做日志文件组中文件的数量,默认2
innodb_log_file_size 重做日志文件的大小。
innodb_mirrored_log_groups 指定了日志镜像文件组的数量,默认1
redolog的两阶段提交
-
先读取数据,并更新然后将新行数据保存在内存中
-
将物理更新记录写入redo-log,并标记这条记录为prepare状态(第一步)
-
InnoDB将操作提交到执行器,执行器再将逻辑更新记录写入bin-log,同时调用引擎的写入和更新接口将磁盘文件更新
-
上一步操作完成后再提交事物,将redo-log中对应的记录状态改为commit状态(第二步)
-
返回更新结果
undo log
保存事务发生之前的数据的一个版本,可以用于回滚,实现事务的原子性,同时可以提供多版本并发控制下的读(MVCC),也即非锁定读。
逻辑格式的日志,在执行undo的时候,仅仅是将数据从逻辑上恢复至事务之前的状态,而不是从物理页面上操作实现的,这一点是不同于redo log。
事务开始之前,将当前是的版本生成undo log,undo 也会产生 redo 来保证undo log的可靠性
当事务提交之后,undo log并不能立马被删除,而是放入待清理的链表,由purge线程判断是否由其他事务 在使用undo段中表的上一个事务之前的版本信息,决定是否可以清理undo log的日志空间。
对应的物理文件:MySQL5.6之前,undo表空间位于共享表空间的回滚段中,共享表空间的默认的名称是ibdata,位于数据文件目录中。
MySQL5.6之后,undo表空间可以配置成独立的文件,但是提前需要在配置文件中配置,完成数据库初始化后生效且不可改变undo log文件的个数,如果初始化数据库之前没有进行相关配置,那么就无法配置成独立的表空间了。
MySQL5.7之后的独立undo表空间配置参数如下:
innodb_undo_directory = /data/undospace/ –undo独立表空间的存放目录
innodb_undo_logs = 128 –回滚段为128KB
innodb_undo_tablespaces = 4 –指定有4个undo log文件
如果undo使用的共享表空间,这个共享表空间中又不仅仅是存储了undo的信息, 共享表空间的默认为与MySQL的数据目录下面,其属性由参数innodb_data_file_path配置。
binlog
redo log适用于崩溃恢复(crash-safe),binlog则适用于主从复制和数据恢复。 用于复制,在主从复制中,从库利用主库上的binlog进行重播,实现主从同步。 用于数据库的基于时间点的还原。 binlog是Server层实现的,所有引擎都可以使用 binlog日志。
逻辑格式的日志,和物理日志不同,逻辑日志记录的记录具体数据是怎么变动的,其记录的是一个过程。 undo log、binlog、relay log都属于逻辑日志,记录数据的变动过程或SQL语句的逻辑。
比如sql语句(增删改)操作:
delete 对应记录 delete本身和其反向的insert
update 对应记录 update执行前后的版本的信息
insert 对应记录 delete和insert本身的信息
binlog的默认是保持时间由参数expire_logs_days配置,在生成时间超过expire_logs_days配置的天数之后,会被自动删除。
配置文件的路径为log_bin_basename,binlog日志文件通过max_binlog_size参数指定每个binlog文件大小,
binlog 通过追加的方式记录,当文件大小大于给定值后 ,进行滚动更新,生成新的日志文件。
对于每个binlog日志文件,通过一个统一的index文件来组织。
mysql通过sync_binlog参数控制biglog的刷盘时机,取值范围是0-N:
- 0:不去强制要求,由系统自行判断何时写入磁盘;
- 1:每次commit的时候都要将binlog写入磁盘;
- N:每N个事务,才会将binlog写入磁盘。 sync_binlog最安全的是设置是1,这也是MySQL 5.7.7之后版本的默认值
binlog 日志有三种格式, STATEMENT, ROW 和 MIXED.
在 MySQL 5.7.7之前,默认的格式是STATEMENT,MySQL 5.7.7之后,默认值是ROW。日志格式通过binlog-format指定。
-
STATMENT : 基于SQL语句的复制(statement-based replication, SBR),每一条会修改数据的sql语句会记录到binlog中。
- 优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO, 从而提高了性能;
- 缺点:在某些情况下会导致主从数据不一致,比如执行sysdate()、slepp()等。
-
ROW : 基于行的复制(row-based replication, RBR),不记录每条sql语句的上下文信息,仅需记录哪条数据被修改了。
-
优点:不会出现某些特定情况下的存储过程、或function、或trigger的调用和触发无法被正确复制的问题;
-
缺点:会产生大量的日志,尤其是alter table的时候会让日志暴涨
-
-
MIXED : 基于STATMENT和ROW两种模式的混合复制(mixed-based replication, MBR), 一般的复制使用STATEMENT模式保存binlog,对于STATEMENT模式无法复制的操作使用ROW模式保存binlog.
MySQL主从复制原理图
参考
- MySQL 的 crash-safe 原理解析
- MySQL不会丢失数据的秘密,就藏在它的 7种日志里
- InnoDB源码分析 Redo log
- InnoDB源码分析 Redo log
- 庖丁解InnoDB之REDO LOG
- MySQL · 引擎特性 · 8.0 Innodb redo log record 源码分析
- MySQL · 引擎特性 · InnoDB redo log漫游
- MySQL8——REDO无锁重构剖析
- InnoDB——Btree与MTR的牵扯
- MySQL5.7——不得不了解的Binlog
- MySQL 8.0: New Lock free, scalable WAL design
- MYSQL无锁化WAL系统
- MySQL · 特性分析 · 8.0 对WAL的设计修改
- MySQL · InnoDB · Redo log
- MySQL在从库读到了比主库更加新的数据?
- 彻底搞懂三大MySQL日志,Redo Log、Undo Log、Bin Log
- MYSQL 是如何保证binlog 和redo log同时提交的?