MySQL内核

MySQL内核

姜承尧, 等著

出版社:电子工业出版社

年代:2014

定价:69.0

书籍简介:

本书由资深MySQL专家亲自执笔,在以往出版的两本InnoDB介绍性图书的基础之上,更深入地介绍InnoDB存储引擎的内核,例如latch、B+树索引、事务、锁等,从源代码的角度深度解析了InnoDB的体系结构、实现原理、工作机制,并给出了大量最佳实践,希望通过本书帮助用户真正了解一个数据库存储引擎的开发。

书籍目录:

第1 章 概览.. 1

1.1 InnoDB 存储引擎历史. 1

1.2 源码版本............ 2

1.3 源码风格............ 3

1.3.1 源码结构 3

1.3.2 代码风格 4

1.4 代码编译............ 4

1.5 阅读源码次序.... 5

1.6 思考题... 6

1.7 继续阅读............ 6

第2 章 基本数据结构与算法.. 7

2.1 相关文件............ 7

2.2 内存管理系统.... 8

2.2.1 内存管理 8

2.2.2 通用内存池..... 11

2.3 哈希表. 14

2.3.1 哈希算法........ 14

2.3.2 数据结构........ 16

2.4 双链表. 17

2.4.1 内存双链表..... 18

2.4.2 磁盘双链表..... 19

2.5 其他数据结构和算法. 20

2.5.1 动态数组........ 21

2.5.2 排序...... 21

2.6 小结.... 22

2.7 思考题. 22

X | 目录

2.8 继续阅读.......... 22

第3 章 同步机制..... 23

3.1 相关文件.......... 23

3.2 基础知识.......... 23

3.2.1 memory model 24

3.2.2 mutual exclution.......... 25

3.2.3 Atomic Read-Modify-Write Operation... 26

3.2.4 spin lock......... 27

3.2.5 死锁...... 29

3.3 InnoDB 同步机制....... 30

3.3.1 mutex.... 30

3.3.2 rw-lock. 34

3.3.3 wait array........ 36

3.3.4 死锁检测........ 38

3.4 小结.... 39

3.5 思考题. 39

3.6 继续阅读.......... 40

第4 章 重做日志..... 41

4.1 相关文件.......... 41

4.2 相关概念.......... 41

4.2.1 简介...... 41

4.2.2 物理逻辑日志. 45

4.2.3 LSN...... 45

4.2.4 检查点.. 47

4.2.5 归档日志........ 48

4.2.6 恢复...... 49

4.3 物理存储结构.. 49

4.3.1 重做日志物理架构...... 49

4.3.2 重做日志块..... 51

4.3.3 重做日志组与文件...... 53

4.4 相关数据结构.. 55

4.4.1 log_group_struct.......... 55

4.4.2 log_struct........ 56

4.5 组提交. 60

4.6 恢复.... 61

4.6.1 数据结构........ 61

4.6.2 重做日志恢复. 62

4.7 总结.... 66

4.8 思考题. 66

4.9 继续阅读.......... 66

第5 章 mini-transaction...... 67

5.1 相关文件.......... 67

5.2 mini-transaction 介绍. 67

5.2.1 基本概念........ 67

5.2.2 The FIX Rules 68

5.2.3 Write-Ahead Log(WAL)......... 69

5.2.4 Force-log-at-commit.... 69

5.3 具体实现.......... 70

5.3.1 数据结构........ 70

5.3.2 物理逻辑日志的实现... 71

5.3.3 mini-transaction 的使用............ 72

5.4 示例.... 73

5.5 小结.... 76

5.6 思考题. 76

5.7 继续阅读.......... 76

第6 章 存储管理..... 77

6.1 相关文件.......... 77

6.2 物理存储.......... 77

6.2.1 页.......... 78

6.2.2 区.......... 79

6.2.3 段.......... 82

6.2.4 表空间.. 84

6.3 数据结构.......... 86

6.3.1 概述...... 86

6.3.2 fil_system_struct.......... 86

6.3.3 fil_space_struct............ 87

6.3.4 fil_node_struct 88

6.4 异步I/O........... 91

6.4.1 异步I/O 数据结构....... 91

6.4.2 异步I/O 线程. 94

6.5 总结.... 95

6.6 思考题. 95

6.7 继续阅读.......... 95

第 7 章 记录 97

7.1 相关文件.......... 97

7.2 概述.... 98

7.3 物理记录.......... 99

7.3.1 物理记录格式. 99

7.3.2 大记录格式... 103

7.3.3 伪记录 106

7.4 逻辑记录........ 107

7.5 记录之间的比较....... 108

7.6 行记录版本.....111

7.7 小结.. 115

7.8 思考题............ 115

7.9 继续阅读........ 115

第8 章 索引页....... 117

8.1 相关文件........ 117

8.2 页...... 117

8.3 存储结构........ 118

8.3.1 Page Header.. 118

8.3.2 Page Directory........... 121

8.3.3 示例.... 122

8.4 Page Cursor.... 125

8.4.1 定位记录...... 125

8.4.2 插入记录...... 127

8.4.3 删除记录...... 130

8.4.4 并发控制...... 130

8.5 小结.. 131

8.6 思考题............ 131

8.7 继续阅读........ 131

第9 章 锁.. 133

9.1 相关文件........ 133

9.2 锁与事务........ 133

9.2.1 隔离性 133

9.2.2 事务的隔离级别........ 135

9.2.3 幻读.... 136

9.3 InnoDB 存储引擎中锁的类型与算法. 137

9.4 锁的内部实现 139

9.4.1 数据结构...... 139

9.4.2 锁的并发控制............ 143

9.4.3 锁的类型与模式........ 143

9.4.4 锁的兼容性... 144

9.5 显式锁和隐式锁....... 145

9.5.1 显式锁与隐式锁的区别.......... 145

9.5.2 聚集索引记录的隐式锁.......... 146

9.5.3 辅助索引记录的隐式锁.......... 146

9.6 加锁操作........ 152

9.6.1 加锁流程...... 152

9.6.2 加锁过程...... 154

9.7 行锁的维护.... 154

9.7.1 插入.... 154

9.7.2 更新.... 155

9.7.3 PURGE......... 156

9.7.4 一致性的锁定读........ 158

9.7.5 页的分裂...... 159

9.7.6 页的合并...... 162

9.8 自增锁............ 164

9.9 死锁.. 165

9.9.1 死锁的概念... 165

9.9.2 死锁概率...... 167

9.9.3 死锁的示例... 168

9.10 小结 170

9.11 思考题.......... 171

9.12 继续阅读...... 171

第10 章 B+ 树索引............ 173

10.1 B+ 树............ 173

10.1.1 概述.. 173

10.1.2 插入.. 176

10.1.3 删除.. 179

10.2 B+ 树索引.... 180

10.2.1 索引的特点. 180

10.2.2 聚集索引.... 181

10.2.3 辅助索引.... 185

10.2.4 填充因子.... 190

10.3 InnoDB 存储引擎B+ 树索引实现.... 191

10.3.1 数据结构.... 191

10.3.2 相关latch... 192

10.3.3 整理.. 192

10.3.4 分裂.. 192

10.3.5 合并.. 200

10.4 查找 201

10.4.1 mode. 201

10.4.2 latch_mode... 204

10.4.3 cursor 205

10.5 DML 操作.... 207

10.5.1 插入.. 207

10.5.2 非主键更新. 210

10.5.3 主键更新.... 215

10.5.4 删除.. 216

10.6 持久游标...... 219

10.7 自适应哈希索引..... 221

10.7.1 实现原理.... 221

10.7.2 创建哈希索引.......... 225

10.7.3 哈希索引的维护...... 226

10.7.4 自适应哈希索引的优缺点.... 227

10.8 小结 227

10.9 思考题.......... 228

10.10 继续阅读.... 228

第11 章 Insert Buffer......... 229

11.1 相关文件...... 229

11.2 基本概念...... 229

11.3 架构实现...... 231

11.3.1 存储结构..... 231

11.3.2 逻辑控制..... 233

11.3.3 示例.. 234

11.4 相关数据结构......... 236

11.5 死锁. 237

11.5.1 latch 顺序.... 237

11.5.2 并发控制..... 239

11.5.3 异步I/O 线程........... 240

11.6 维护. 241

11.6.1 记录合并..... 241

11.6.2 空间收缩..... 242

11.7 小结. 243

11.8 思考题.......... 244

11.9 继续阅读...... 244

第12 章 缓冲池..... 245

12.1 相关文件...... 245

12.2 概述 246

12.2.1 缓冲池........ 246

12.2.2 LRU、Free 和Flush 链表..... 249

12.2.3 基本数据结构.......... 251

12.3 缓冲池的管理........ 255

12.3.1 LRU 算法... 255

12.3.2 LRU 链表维护......... 255

12.3.3 页的分配.... 256

12.4 页的读取...... 257

12.4.1 物理读取.... 257

12.4.2 随机预读.... 258

12.4.3 线性预读.... 259

12.4.4 逻辑读取.... 262

12.5 页的刷新...... 264

12.5.1 检查点........ 264

12.5.2 部分写的问题.......... 266

12.5.3 刷新的实现. 267

12.6 小结 269

12.7 思考题.......... 269

12.8 继续阅读...... 270

第13 章 事务处理. 271

13.1 相关文件........ 271

13.2 事务.. 272

13.2.1 概述.... 272

13.2.2 分类.... 274

13.2.1 隔离级别...... 275

13.3 事务系统结构 275

13.3.1 事务系统段.. 275

13.3.2 数据结构...... 277

13.4 DOUBLEWRITE 段. 280

13.5 UNDO 日志存储...... 281

13.5.1 简介.... 281

13.5.2 实现结构...... 283

13.5.3 回滚段 283

13.5.4 UNDO 段...... 284

13.6 UNDO 记录... 288

13.6.1 存储结构...... 288

13.6.2 INSERT UNDO LOG RECORD.......... 290

13.6.3 UPDATE UNDO LOG RECORD......... 292

13.7 PURGE.......... 299

13.7.1 清理操作...... 299

13.7.2 实现原理...... 300

13.8 ROLLBACK.. 303

13.8.1 回滚指针...... 303

13.8.2 回滚操作...... 303

13.9 COMMIT....... 306

13.10 kernel_mutex 与并发控制... 308

13.11 小结 309

13.12 思考题......... 309

13.13 继续阅读...... 309

第14 章 数据字典. 311

14.1 相关文件........ 311

14.2 数据字典概述 312

14.3 主要数据对象 312

14.3.1 数据字典系统............ 312

14.3.2 表定义 314

14.3.3 索引定义...... 316

14.3.4 外键约束定义............ 317

14.3.5 其他数据对象定义.... 319

14.4 InnoDB 系统表对象. 319

14.4.1 SYS_TABLES........... 319

14.4.2 SYS_COLUMNS....... 320

14.4.3 SYS_INDEXES......... 321

14.4.4 SYS_FIELDS............ 322

14.4.5 其他表对象.. 322

14.5 数据字典创建 323

14.5.1 数据字典段.. 324

14.5.2 数据字典物理结构.... 324

14.5.3 数据字典初始化........ 325

14.5.4 数据字典缓存组织.... 326

14.6 数据字典对象加载... 327

14.6.1 用户表加载.. 327

14.6.2 用户索引和外键约束加载...... 328

14.7 小结.. 329

14.8 思考题........... 329

14.9 继续阅读........ 329

第15 章 服务管理. 331

15.1 相关文件........ 331

15.2 初始化InnoDB 存储引擎.................. 331

15.2.1 相关重要参数............ 333

15.2.2 服务管理相关数据结构.......... 333

15.2.3 文件创建和加载........ 335

15.2.4 启动后台线程............ 337

15.3 关闭InnoDB 存储引擎......... 337

15.3.1 数据持久化.. 338

15.3.2 资源释放...... 338

15.4 master 线程.... 339

15.4.1 主要功能...... 339

15.4.2 数据刷盘策略............ 339

15.5 锁超时监控线程...... 341

15.6 思考题........... 342

15.7 继续阅读........ 342

内容摘要:

本书由资深MySQL专家亲自执笔,在以往出版的两本InnoDB介绍性图书的基础之上,更深入地介绍InnoDB存储引擎的内核,例如latch、B+树索引、事务、锁等,从源代码的角度深度解析了InnoDB的体系结构、实现原理、工作机制,并给出了大量最佳实践,希望通过本书帮助用户真正了解一个数据库存储引擎的开发。姜承尧(DavidJiang),MySQL领域的Oracle ACE,资深MySQL数据库专家,擅长于数据库的故障诊断、性能调优、容灾处理、高可用和高扩展研究,同时一直致力于MySQL数据库底层实现原理的研究和探索。此外,对高性能数据库和数据仓库也有深刻而独到的理解。曾为MySQL编写了许多开源工具和性能扩展补丁,如广受好评的InnoDB引擎二级缓存项目。现任网易杭州研究院技术经理一职,负责MySQL数据库的内核开发,参与设计与开发MySQL数据库在网易云环境中的应用。曾担任久游网数据库工程部经理,曾领导并参与了多个大型核心数据库的设计、实施、管理和维护,实战经验非常丰富。活跃于开源数据库以及开源软件领域,是著名开源社区ChinaUnixMySQL版块的版主,热衷于与网友分享自己的心得和体会,深受社区欢迎。为什么要写这本书过去这些年,我一直在和各种不同的数据库打交道,见证了MySQL 从一个小型的关系型数据库发展成为各大互联网企业的核心数据库系统的过程。期间我参与了一些大大小小的项目开发工作,成功地帮助开发人员构建了一些可靠的、健壮的应用程序。在这个过程中积累了一些经验,正是这些不断累积的经验赋予了我灵感,于是有了本书。这本书实际上反映了这些年来我做了哪些事情,汇集了很多同行每天可能都会遇到的一些问题,并给出解决方案。本书是MySQL 内核系列的第一本书,与之前出版的MySQL 技术内幕不同的是,该系列的书将更靠近数据库内核层面,揭示MySQL 数据库内核是如何运行的。MySQL 内核系列的第一本书将从InnoDB 存储引擎的内核来展开。毫无疑问,InnoDB 存储引擎已经成为MySQL 数据库的“标准配置”。Facebook、Twitter、Yahoo、百度、淘宝、腾讯、网易这些互联网公司都将InnoDB 作为后台的存储引擎。在时间的长河以及线上高并发验证下,其已经被证明是高性能、高可扩展性的引擎。身处数据库这个圈子,可以明显地感觉到从2010 年开始,各大互联网公司已经不再满足于仅仅使用InnoDB 存储引擎,他们开始越来越接触到引擎的内核层面,对引擎进行内核级别的优化以及根据公司的业务需求进行二次开发。即使是DBA 本身也开始慢慢地不满足现状开始研究起InnoDB 存储引擎的内核,似乎一夜之间不了解点内核实现都不好意思和别人说你是搞MySQL 数据库的。当然,我们需要感谢MySQL 数据库,感谢MySQL 数据库的创始人和InnoDB 存储引擎的创始人。正是他们开源了这些代码,使得我们这些后人可以站在巨人的肩膀上继续学习与进步。在这方面,MySQL/InnoDB 比其他数据库都要伟大,更值得我们尊敬。不可否认的是,国内对于数据库内核的开发学习资料与课程都非常有限。本科阶段几乎没有相关课程,仅特定数据库研究方向的研究生才会去关注这些技术,并且这些人才在国内非常稀少。很多想要踏进数据库内核领域的人在最初都会感到迷茫和无助。IV | 前言另外,有些人凭着自己的聪明与天赋看似掌握了内核的实现,但是从他们的博客描述来看,其离真正的理解还是有一些距离的,或者说他们仅刚入门。所以我们才会在网上看到不断有人在翻阅过代码后,或者简单设置了几个断点和调试后抱怨InnoDB 存储引擎的设计是多么烂。数据库的世界并不如他们想象的那样简单与粗糙,数据库有着自己的理论体系。虽然数据库的实现有很多种,但大多需要遵循一些理论规范,如Fix Rules、Write-Ahead Log、Forcelog-at-commit、Lock 等。我从2006 年就开始进行数据库的内核开发,现在想来还最多只能称为hack。我在内核开发的路上走了很多弯路,经过高人的指点以及自己不断的学习与探索,终于有了一些经验,现通过本书来完整地展示给读者。希望通过MySQL 内核系列,使正在通往或已经在数据库内核开发道路的人员少走弯路。出于这个目的,我联合了网易MySQL 技术组的各位同事,完成了InnoDB 存储引擎卷1 的书籍撰写工作。其中第1、3、4、5、7、8、9、10、11 章由我个人独立完成,第2 和第14章由我和温正湖共同完成、第6 和第12 章由我和饶陇辉共同完成、第13 和第15 章由我和蒋鸿翔共同完成。在每章的最后,我还给出了思考题以及继续阅读的参考资料,通过这部分的内容,读者可以加深对于每个知识模块的理解,并继续对某一模块进行深入研究。读者对象本书面向的读者群:y 数据库管理员y 数据库架构设计师y 数据库内核开发人员y 其他对数据库内核感兴趣的开发人员如何阅读本书本书一共有15 章,每章都像一本“迷你书”,可以单独成册。用户可以有选择地阅读,但是更推荐根据本书的组织方式进行阅读,这样会更具有条理性。第1 章 概览本章首先介绍了MySQL 数据库以及InnoDB 存储引擎的历史,之后介绍了InnoDB 存储引擎的源码结构与代码风格,最后推荐了阅读InnoDB 存储引擎源码的次序。前言 | V第2 章 基本数据结构与算法本章对InnoDB 中常用的数据结构和算法进行了介绍。首先是InnoDB 的内存管理系统,从内存管理机制、内存操作基元和内存池及内存区等概念着手进行了详细讲解;之后是哈希表结构,介绍了简单哈希表和带链哈希表两种;然后介绍了双链表结构;最后还介绍了动态数组、标准排序函数。本章的内容是InnoDB 的基础,相信读者在阅读后续章节的代码时一定会遇到本章所提的相关数据结构与算法。第3 章 同步机制本章介绍了InnoDB 存储引擎中实现的同步机制mutex 和rw-lock。InnoDB 存储引擎正是通过这些数据结构才能完成正确并发控制的。第4 章 重做日志本章首先介绍与重做日志模块相关的概念,之后具体分析了InnoDB 存储引擎重做日志模块的实现。InnoDB 存储引擎原先就支持组提交,因此有着相当不错的性能。最后,根据之前所介绍的内容,分析了如何通过重做日志进行有效恢复,从而实现事务系统持久性的要求。第5 章 mini-transaction本章介绍了数据库中的三个协议:Fix Rules、Write-Ahead Log、Force-Log-at-Commit,同时介绍了InnoDB 存储引擎中mini-transaction 的实现,并通过一个示例简单展示了minitransaction产生的重做日志内容。第6 章 存储管理本章介绍了InnoDB 存储引擎的物理存储方式,这包括表空间的构成,段、区、页的存储管理。此外,还介绍了InnoDB 存储引擎的文件操作方式,包括文件操作的架构设计、同步读/写方式和异步读/ 写方式,分别介绍了Windows 操作系统、Posix 操作系统以及InnoDB 模拟的三种异步I/O 的实现方法。第7 章 记录本章介绍了InnoDB 存储引擎的记录(record),使读者了解在源码中记录可以分为物理记录与逻辑记录,以及各种记录所使用的场合。第8 章 索引页本章介绍了InnoDB 存储引擎的索引页,知道在源码中页可以分为物理页与逻辑页,并且详细分析了page header 以及page directory。此外,还对InnoDB 存储引擎如何在页中进行记录的定位、插入和删除等操作进行了详细介绍。VI | 前言第9 章 锁本章介绍了InnoDB 存储引擎锁的实现技术。在InnoDB 存储引擎中,其通过next-keylocking 算法在事务隔离级别为REPEATABLE READ 实现了完全的隔离性要求。此外,其对锁的设计是一种极其高效的设计方式。每个内核开发人员都应该细读lock 模块,从而更为深入地理解锁的内部实现。第10 章 B+ 树索引本章对InnoDB 存储引擎的B+ 树索引实现做了十分详细的介绍。该部分所需要涉及的内容非常多,与前面章节的联系也比较紧密,是一个极为重要的章节。希望读者可以反复阅读,从而更好地体会InnoDB 存储引擎中B+ 树索引的实现。第11 章 Insert Buffer本章介绍了InnoDB 存储引擎中Insert Buffer 的实现,首先介绍了Insert Buffer 的基本概念,然后介绍了Insert Buffer 的物理与逻辑存储结构,并通过一个示例进行展示。最后,介绍了Insert Buffer 的源码实现。我认为这个模块是难度最大的模块之一。第12 章 缓冲池本章介绍了InnoDB 存储引擎缓冲池的实现,这包括缓冲池的管理、页的读取和页的刷新。此外,还介绍了InnoDB 存储引擎使用midpoint insertion strategy LRU 的LRU 管理机制。第13 章 事务处理本章介绍了InnoDB 存储引擎的事务处理模块,介绍了InnoDB 存储引擎对于undo 记录的存储方式,这其中涉及事务系统段、回滚段、undo 段、undo 页、undo 日志、undo 记录等多个概念,读者应该好好地理清这些概念。此外,还讲述了事务的purge、rollback、commit 等操作的具体实现。相信通过本章的学习读者可以了解如何设计一个高效的事务系统。第14 章 数据字典本章介绍了InnoDB 存储引擎对于数据字典的具体实现,以及其与之前各章的联系。第15 章 服务管理本章介绍了InnoDB 存储引擎各服务模块的管理,并展示了这些服务模块的具体实现。勘误和支持由于水平有限,编写时间仓促,书中难免会出现一些错误或不准确的地方,恳请读者批评指正,前言 | VII我将尽力在线上为你提供最满意的解答。如果你有更多的宝贵意见,也欢迎发送邮件至邮箱jiangchengyao@gmail.com,期待能够得到您最真挚的反馈。致谢感谢网易研究院的所有同事们,能与一群才华出众的人一起工作让我感到非常荣幸与自豪,同时通过不断地与他人的交流,使我在数据库方面得到了极大的提升和领悟。感谢电子工业出版社博文视点公司的孙学瑛老师,她在这段时间内始终支持我的写作,正是她的鼓励和帮助引导我顺利完成全部书稿。谨以此书献给我最亲爱的家人,以及众多热爱MySQL 数据库的朋友们!姜承尧(David Jiang)2014 年3 月于中国杭州

书籍规格:

书籍详细信息
书名MySQL内核站内查询相似图书
9787121229084
如需购买下载《MySQL内核》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位电子工业出版社
版次1版印次1
定价(元)69.0语种简体中文
尺寸24 × 19装帧平装
页数印数

书籍信息归属:

MySQL内核是电子工业出版社于2014.5出版的中图分类号为 TP311.138 的主题关于 关系数据库系统 的书籍。