出版社:电子工业出版社
年代:2014
定价:69.0
本书由资深MySQL专家亲自执笔,在以往出版的两本InnoDB介绍性图书的基础之上,更深入地介绍InnoDB存储引擎的内核,例如latch、B+树索引、事务、锁等,从源代码的角度深度解析了InnoDB的体系结构、实现原理、工作机制,并给出了大量最佳实践,希望通过本书帮助用户真正了解一个数据库存储引擎的开发。
第1 章 概览.. 1
1.1 InnoDB 存储引擎历史. 1
1.2 源码版本............ 2
1.3 源码风格............ 3
1.3.1 源码结构 3
1.3.2 代码风格 4
1.4 代码编译............ 4
1.5 阅读源码次序.... 5
1.6 思考题... 6
1.7 继续阅读............ 6
第2 章 基本数据结构与算法.. 7
2.1 相关文件............ 7
2.2 内存管理系统.... 8
2.2.1 内存管理 8
2.2.2 通用内存池..... 11
2.3 哈希表. 14
2.3.1 哈希算法........ 14
2.3.2 数据结构........ 16
2.4 双链表. 17
2.4.1 内存双链表..... 18
2.4.2 磁盘双链表..... 19
2.5 其他数据结构和算法. 20
2.5.1 动态数组........ 21
2.5.2 排序...... 21
2.6 小结.... 22
2.7 思考题. 22
X | 目录
2.8 继续阅读.......... 22
第3 章 同步机制..... 23
3.1 相关文件.......... 23
3.2 基础知识.......... 23
3.2.1 memory model 24
3.2.2 mutual exclution.......... 25
3.2.3 Atomic Read-Modify-Write Operation... 26
3.2.4 spin lock......... 27
3.2.5 死锁...... 29
3.3 InnoDB 同步机制....... 30
3.3.1 mutex.... 30
3.3.2 rw-lock. 34
3.3.3 wait array........ 36
3.3.4 死锁检测........ 38
3.4 小结.... 39
3.5 思考题. 39
3.6 继续阅读.......... 40
第4 章 重做日志..... 41
4.1 相关文件.......... 41
4.2 相关概念.......... 41
4.2.1 简介...... 41
4.2.2 物理逻辑日志. 45
4.2.3 LSN...... 45
4.2.4 检查点.. 47
4.2.5 归档日志........ 48
4.2.6 恢复...... 49
4.3 物理存储结构.. 49
4.3.1 重做日志物理架构...... 49
4.3.2 重做日志块..... 51
4.3.3 重做日志组与文件...... 53
4.4 相关数据结构.. 55
4.4.1 log_group_struct.......... 55
4.4.2 log_struct........ 56
4.5 组提交. 60
4.6 恢复.... 61
4.6.1 数据结构........ 61
4.6.2 重做日志恢复. 62
4.7 总结.... 66
4.8 思考题. 66
4.9 继续阅读.......... 66
第5 章 mini-transaction...... 67
5.1 相关文件.......... 67
5.2 mini-transaction 介绍. 67
5.2.1 基本概念........ 67
5.2.2 The FIX Rules 68
5.2.3 Write-Ahead Log(WAL)......... 69
5.2.4 Force-log-at-commit.... 69
5.3 具体实现.......... 70
5.3.1 数据结构........ 70
5.3.2 物理逻辑日志的实现... 71
5.3.3 mini-transaction 的使用............ 72
5.4 示例.... 73
5.5 小结.... 76
5.6 思考题. 76
5.7 继续阅读.......... 76
第6 章 存储管理..... 77
6.1 相关文件.......... 77
6.2 物理存储.......... 77
6.2.1 页.......... 78
6.2.2 区.......... 79
6.2.3 段.......... 82
6.2.4 表空间.. 84
6.3 数据结构.......... 86
6.3.1 概述...... 86
6.3.2 fil_system_struct.......... 86
6.3.3 fil_space_struct............ 87
6.3.4 fil_node_struct 88
6.4 异步I/O........... 91
6.4.1 异步I/O 数据结构....... 91
6.4.2 异步I/O 线程. 94
6.5 总结.... 95
6.6 思考题. 95
6.7 继续阅读.......... 95
第 7 章 记录 97
7.1 相关文件.......... 97
7.2 概述.... 98
7.3 物理记录.......... 99
7.3.1 物理记录格式. 99
7.3.2 大记录格式... 103
7.3.3 伪记录 106
7.4 逻辑记录........ 107
7.5 记录之间的比较....... 108
7.6 行记录版本.....111
7.7 小结.. 115
7.8 思考题............ 115
7.9 继续阅读........ 115
第8 章 索引页....... 117
8.1 相关文件........ 117
8.2 页...... 117
8.3 存储结构........ 118
8.3.1 Page Header.. 118
8.3.2 Page Directory........... 121
8.3.3 示例.... 122
8.4 Page Cursor.... 125
8.4.1 定位记录...... 125
8.4.2 插入记录...... 127
8.4.3 删除记录...... 130
8.4.4 并发控制...... 130
8.5 小结.. 131
8.6 思考题............ 131
8.7 继续阅读........ 131
第9 章 锁.. 133
9.1 相关文件........ 133
9.2 锁与事务........ 133
9.2.1 隔离性 133
9.2.2 事务的隔离级别........ 135
9.2.3 幻读.... 136
9.3 InnoDB 存储引擎中锁的类型与算法. 137
9.4 锁的内部实现 139
9.4.1 数据结构...... 139
9.4.2 锁的并发控制............ 143
9.4.3 锁的类型与模式........ 143
9.4.4 锁的兼容性... 144
9.5 显式锁和隐式锁....... 145
9.5.1 显式锁与隐式锁的区别.......... 145
9.5.2 聚集索引记录的隐式锁.......... 146
9.5.3 辅助索引记录的隐式锁.......... 146
9.6 加锁操作........ 152
9.6.1 加锁流程...... 152
9.6.2 加锁过程...... 154
9.7 行锁的维护.... 154
9.7.1 插入.... 154
9.7.2 更新.... 155
9.7.3 PURGE......... 156
9.7.4 一致性的锁定读........ 158
9.7.5 页的分裂...... 159
9.7.6 页的合并...... 162
9.8 自增锁............ 164
9.9 死锁.. 165
9.9.1 死锁的概念... 165
9.9.2 死锁概率...... 167
9.9.3 死锁的示例... 168
9.10 小结 170
9.11 思考题.......... 171
9.12 继续阅读...... 171
第10 章 B+ 树索引............ 173
10.1 B+ 树............ 173
10.1.1 概述.. 173
10.1.2 插入.. 176
10.1.3 删除.. 179
10.2 B+ 树索引.... 180
10.2.1 索引的特点. 180
10.2.2 聚集索引.... 181
10.2.3 辅助索引.... 185
10.2.4 填充因子.... 190
10.3 InnoDB 存储引擎B+ 树索引实现.... 191
10.3.1 数据结构.... 191
10.3.2 相关latch... 192
10.3.3 整理.. 192
10.3.4 分裂.. 192
10.3.5 合并.. 200
10.4 查找 201
10.4.1 mode. 201
10.4.2 latch_mode... 204
10.4.3 cursor 205
10.5 DML 操作.... 207
10.5.1 插入.. 207
10.5.2 非主键更新. 210
10.5.3 主键更新.... 215
10.5.4 删除.. 216
10.6 持久游标...... 219
10.7 自适应哈希索引..... 221
10.7.1 实现原理.... 221
10.7.2 创建哈希索引.......... 225
10.7.3 哈希索引的维护...... 226
10.7.4 自适应哈希索引的优缺点.... 227
10.8 小结 227
10.9 思考题.......... 228
10.10 继续阅读.... 228
第11 章 Insert Buffer......... 229
11.1 相关文件...... 229
11.2 基本概念...... 229
11.3 架构实现...... 231
11.3.1 存储结构..... 231
11.3.2 逻辑控制..... 233
11.3.3 示例.. 234
11.4 相关数据结构......... 236
11.5 死锁. 237
11.5.1 latch 顺序.... 237
11.5.2 并发控制..... 239
11.5.3 异步I/O 线程........... 240
11.6 维护. 241
11.6.1 记录合并..... 241
11.6.2 空间收缩..... 242
11.7 小结. 243
11.8 思考题.......... 244
11.9 继续阅读...... 244
第12 章 缓冲池..... 245
12.1 相关文件...... 245
12.2 概述 246
12.2.1 缓冲池........ 246
12.2.2 LRU、Free 和Flush 链表..... 249
12.2.3 基本数据结构.......... 251
12.3 缓冲池的管理........ 255
12.3.1 LRU 算法... 255
12.3.2 LRU 链表维护......... 255
12.3.3 页的分配.... 256
12.4 页的读取...... 257
12.4.1 物理读取.... 257
12.4.2 随机预读.... 258
12.4.3 线性预读.... 259
12.4.4 逻辑读取.... 262
12.5 页的刷新...... 264
12.5.1 检查点........ 264
12.5.2 部分写的问题.......... 266
12.5.3 刷新的实现. 267
12.6 小结 269
12.7 思考题.......... 269
12.8 继续阅读...... 270
第13 章 事务处理. 271
13.1 相关文件........ 271
13.2 事务.. 272
13.2.1 概述.... 272
13.2.2 分类.... 274
13.2.1 隔离级别...... 275
13.3 事务系统结构 275
13.3.1 事务系统段.. 275
13.3.2 数据结构...... 277
13.4 DOUBLEWRITE 段. 280
13.5 UNDO 日志存储...... 281
13.5.1 简介.... 281
13.5.2 实现结构...... 283
13.5.3 回滚段 283
13.5.4 UNDO 段...... 284
13.6 UNDO 记录... 288
13.6.1 存储结构...... 288
13.6.2 INSERT UNDO LOG RECORD.......... 290
13.6.3 UPDATE UNDO LOG RECORD......... 292
13.7 PURGE.......... 299
13.7.1 清理操作...... 299
13.7.2 实现原理...... 300
13.8 ROLLBACK.. 303
13.8.1 回滚指针...... 303
13.8.2 回滚操作...... 303
13.9 COMMIT....... 306
13.10 kernel_mutex 与并发控制... 308
13.11 小结 309
13.12 思考题......... 309
13.13 继续阅读...... 309
第14 章 数据字典. 311
14.1 相关文件........ 311
14.2 数据字典概述 312
14.3 主要数据对象 312
14.3.1 数据字典系统............ 312
14.3.2 表定义 314
14.3.3 索引定义...... 316
14.3.4 外键约束定义............ 317
14.3.5 其他数据对象定义.... 319
14.4 InnoDB 系统表对象. 319
14.4.1 SYS_TABLES........... 319
14.4.2 SYS_COLUMNS....... 320
14.4.3 SYS_INDEXES......... 321
14.4.4 SYS_FIELDS............ 322
14.4.5 其他表对象.. 322
14.5 数据字典创建 323
14.5.1 数据字典段.. 324
14.5.2 数据字典物理结构.... 324
14.5.3 数据字典初始化........ 325
14.5.4 数据字典缓存组织.... 326
14.6 数据字典对象加载... 327
14.6.1 用户表加载.. 327
14.6.2 用户索引和外键约束加载...... 328
14.7 小结.. 329
14.8 思考题........... 329
14.9 继续阅读........ 329
第15 章 服务管理. 331
15.1 相关文件........ 331
15.2 初始化InnoDB 存储引擎.................. 331
15.2.1 相关重要参数............ 333
15.2.2 服务管理相关数据结构.......... 333
15.2.3 文件创建和加载........ 335
15.2.4 启动后台线程............ 337
15.3 关闭InnoDB 存储引擎......... 337
15.3.1 数据持久化.. 338
15.3.2 资源释放...... 338
15.4 master 线程.... 339
15.4.1 主要功能...... 339
15.4.2 数据刷盘策略............ 339
15.5 锁超时监控线程...... 341
15.6 思考题........... 342
15.7 继续阅读........ 342
本书由资深MySQL专家亲自执笔,在以往出版的两本InnoDB介绍性图书的基础之上,更深入地介绍InnoDB存储引擎的内核,例如latch、B+树索引、事务、锁等,从源代码的角度深度解析了InnoDB的体系结构、实现原理、工作机制,并给出了大量最佳实践,希望通过本书帮助用户真正了解一个数据库存储引擎的开发。姜承尧(DavidJiang),MySQL领域的Oracle ACE,资深MySQL数据库专家,擅长于数据库的故障诊断、性能调优、容灾处理、高可用和高扩展研究,同时一直致力于MySQL数据库底层实现原理的研究和探索。此外,对高性能数据库和数据仓库也有深刻而独到的理解。曾为MySQL编写了许多开源工具和性能扩展补丁,如广受好评的InnoDB引擎二级缓存项目。现任网易杭州研究院技术经理一职,负责MySQL数据库的内核开发,参与设计与开发MySQL数据库在网易云环境中的应用。曾担任久游网数据库工程部经理,曾领导并参与了多个大型核心数据库的设计、实施、管理和维护,实战经验非常丰富。活跃于开源数据库以及开源软件领域,是著名开源社区ChinaUnixMySQL版块的版主,热衷于与网友分享自己的心得和体会,深受社区欢迎。为什么要写这本书过去这些年,我一直在和各种不同的数据库打交道,见证了MySQL 从一个小型的关系型数据库发展成为各大互联网企业的核心数据库系统的过程。期间我参与了一些大大小小的项目开发工作,成功地帮助开发人员构建了一些可靠的、健壮的应用程序。在这个过程中积累了一些经验,正是这些不断累积的经验赋予了我灵感,于是有了本书。这本书实际上反映了这些年来我做了哪些事情,汇集了很多同行每天可能都会遇到的一些问题,并给出解决方案。本书是MySQL 内核系列的第一本书,与之前出版的MySQL 技术内幕不同的是,该系列的书将更靠近数据库内核层面,揭示MySQL 数据库内核是如何运行的。MySQL 内核系列的第一本书将从InnoDB 存储引擎的内核来展开。毫无疑问,InnoDB 存储引擎已经成为MySQL 数据库的“标准配置”。Facebook、Twitter、Yahoo、百度、淘宝、腾讯、网易这些互联网公司都将InnoDB 作为后台的存储引擎。在时间的长河以及线上高并发验证下,其已经被证明是高性能、高可扩展性的引擎。身处数据库这个圈子,可以明显地感觉到从2010 年开始,各大互联网公司已经不再满足于仅仅使用InnoDB 存储引擎,他们开始越来越接触到引擎的内核层面,对引擎进行内核级别的优化以及根据公司的业务需求进行二次开发。即使是DBA 本身也开始慢慢地不满足现状开始研究起InnoDB 存储引擎的内核,似乎一夜之间不了解点内核实现都不好意思和别人说你是搞MySQL 数据库的。当然,我们需要感谢MySQL 数据库,感谢MySQL 数据库的创始人和InnoDB 存储引擎的创始人。正是他们开源了这些代码,使得我们这些后人可以站在巨人的肩膀上继续学习与进步。在这方面,MySQL/InnoDB 比其他数据库都要伟大,更值得我们尊敬。不可否认的是,国内对于数据库内核的开发学习资料与课程都非常有限。本科阶段几乎没有相关课程,仅特定数据库研究方向的研究生才会去关注这些技术,并且这些人才在国内非常稀少。很多想要踏进数据库内核领域的人在最初都会感到迷茫和无助。IV | 前言另外,有些人凭着自己的聪明与天赋看似掌握了内核的实现,但是从他们的博客描述来看,其离真正的理解还是有一些距离的,或者说他们仅刚入门。所以我们才会在网上看到不断有人在翻阅过代码后,或者简单设置了几个断点和调试后抱怨InnoDB 存储引擎的设计是多么烂。数据库的世界并不如他们想象的那样简单与粗糙,数据库有着自己的理论体系。虽然数据库的实现有很多种,但大多需要遵循一些理论规范,如Fix Rules、Write-Ahead Log、Forcelog-at-commit、Lock 等。我从2006 年就开始进行数据库的内核开发,现在想来还最多只能称为hack。我在内核开发的路上走了很多弯路,经过高人的指点以及自己不断的学习与探索,终于有了一些经验,现通过本书来完整地展示给读者。希望通过MySQL 内核系列,使正在通往或已经在数据库内核开发道路的人员少走弯路。出于这个目的,我联合了网易MySQL 技术组的各位同事,完成了InnoDB 存储引擎卷1 的书籍撰写工作。其中第1、3、4、5、7、8、9、10、11 章由我个人独立完成,第2 和第14章由我和温正湖共同完成、第6 和第12 章由我和饶陇辉共同完成、第13 和第15 章由我和蒋鸿翔共同完成。在每章的最后,我还给出了思考题以及继续阅读的参考资料,通过这部分的内容,读者可以加深对于每个知识模块的理解,并继续对某一模块进行深入研究。读者对象本书面向的读者群:y 数据库管理员y 数据库架构设计师y 数据库内核开发人员y 其他对数据库内核感兴趣的开发人员如何阅读本书本书一共有15 章,每章都像一本“迷你书”,可以单独成册。用户可以有选择地阅读,但是更推荐根据本书的组织方式进行阅读,这样会更具有条理性。第1 章 概览本章首先介绍了MySQL 数据库以及InnoDB 存储引擎的历史,之后介绍了InnoDB 存储引擎的源码结构与代码风格,最后推荐了阅读InnoDB 存储引擎源码的次序。前言 | V第2 章 基本数据结构与算法本章对InnoDB 中常用的数据结构和算法进行了介绍。首先是InnoDB 的内存管理系统,从内存管理机制、内存操作基元和内存池及内存区等概念着手进行了详细讲解;之后是哈希表结构,介绍了简单哈希表和带链哈希表两种;然后介绍了双链表结构;最后还介绍了动态数组、标准排序函数。本章的内容是InnoDB 的基础,相信读者在阅读后续章节的代码时一定会遇到本章所提的相关数据结构与算法。第3 章 同步机制本章介绍了InnoDB 存储引擎中实现的同步机制mutex 和rw-lock。InnoDB 存储引擎正是通过这些数据结构才能完成正确并发控制的。第4 章 重做日志本章首先介绍与重做日志模块相关的概念,之后具体分析了InnoDB 存储引擎重做日志模块的实现。InnoDB 存储引擎原先就支持组提交,因此有着相当不错的性能。最后,根据之前所介绍的内容,分析了如何通过重做日志进行有效恢复,从而实现事务系统持久性的要求。第5 章 mini-transaction本章介绍了数据库中的三个协议:Fix Rules、Write-Ahead Log、Force-Log-at-Commit,同时介绍了InnoDB 存储引擎中mini-transaction 的实现,并通过一个示例简单展示了minitransaction产生的重做日志内容。第6 章 存储管理本章介绍了InnoDB 存储引擎的物理存储方式,这包括表空间的构成,段、区、页的存储管理。此外,还介绍了InnoDB 存储引擎的文件操作方式,包括文件操作的架构设计、同步读/写方式和异步读/ 写方式,分别介绍了Windows 操作系统、Posix 操作系统以及InnoDB 模拟的三种异步I/O 的实现方法。第7 章 记录本章介绍了InnoDB 存储引擎的记录(record),使读者了解在源码中记录可以分为物理记录与逻辑记录,以及各种记录所使用的场合。第8 章 索引页本章介绍了InnoDB 存储引擎的索引页,知道在源码中页可以分为物理页与逻辑页,并且详细分析了page header 以及page directory。此外,还对InnoDB 存储引擎如何在页中进行记录的定位、插入和删除等操作进行了详细介绍。VI | 前言第9 章 锁本章介绍了InnoDB 存储引擎锁的实现技术。在InnoDB 存储引擎中,其通过next-keylocking 算法在事务隔离级别为REPEATABLE READ 实现了完全的隔离性要求。此外,其对锁的设计是一种极其高效的设计方式。每个内核开发人员都应该细读lock 模块,从而更为深入地理解锁的内部实现。第10 章 B+ 树索引本章对InnoDB 存储引擎的B+ 树索引实现做了十分详细的介绍。该部分所需要涉及的内容非常多,与前面章节的联系也比较紧密,是一个极为重要的章节。希望读者可以反复阅读,从而更好地体会InnoDB 存储引擎中B+ 树索引的实现。第11 章 Insert Buffer本章介绍了InnoDB 存储引擎中Insert Buffer 的实现,首先介绍了Insert Buffer 的基本概念,然后介绍了Insert Buffer 的物理与逻辑存储结构,并通过一个示例进行展示。最后,介绍了Insert Buffer 的源码实现。我认为这个模块是难度最大的模块之一。第12 章 缓冲池本章介绍了InnoDB 存储引擎缓冲池的实现,这包括缓冲池的管理、页的读取和页的刷新。此外,还介绍了InnoDB 存储引擎使用midpoint insertion strategy LRU 的LRU 管理机制。第13 章 事务处理本章介绍了InnoDB 存储引擎的事务处理模块,介绍了InnoDB 存储引擎对于undo 记录的存储方式,这其中涉及事务系统段、回滚段、undo 段、undo 页、undo 日志、undo 记录等多个概念,读者应该好好地理清这些概念。此外,还讲述了事务的purge、rollback、commit 等操作的具体实现。相信通过本章的学习读者可以了解如何设计一个高效的事务系统。第14 章 数据字典本章介绍了InnoDB 存储引擎对于数据字典的具体实现,以及其与之前各章的联系。第15 章 服务管理本章介绍了InnoDB 存储引擎各服务模块的管理,并展示了这些服务模块的具体实现。勘误和支持由于水平有限,编写时间仓促,书中难免会出现一些错误或不准确的地方,恳请读者批评指正,前言 | VII我将尽力在线上为你提供最满意的解答。如果你有更多的宝贵意见,也欢迎发送邮件至邮箱jiangchengyao@gmail.com,期待能够得到您最真挚的反馈。致谢感谢网易研究院的所有同事们,能与一群才华出众的人一起工作让我感到非常荣幸与自豪,同时通过不断地与他人的交流,使我在数据库方面得到了极大的提升和领悟。感谢电子工业出版社博文视点公司的孙学瑛老师,她在这段时间内始终支持我的写作,正是她的鼓励和帮助引导我顺利完成全部书稿。谨以此书献给我最亲爱的家人,以及众多热爱MySQL 数据库的朋友们!姜承尧(David Jiang)2014 年3 月于中国杭州
李丙洋, 著
贺春旸, 著
(美) 迪布瓦 (DuBois,P.) , 著
(美) 贝尔 (Bell,C.) , (美) 肯德尔 (Kindahl,M.) , (美) 塞尔曼 (Thalmann,L.) , 著
张工厂, 著
王雨竹, 等编著
(美) 施瓦茨 (Schwartz,B.) , (美) 扎伊采夫 (Zaitsev,P.) , (美) 特卡琴科 (Tkachenko,V.) , 著
姜承尧, 著
(美) 迪布瓦 (DuBois,P.) , 著