深入聊聊mysql索引为什么采用B+树结构

396 阅读 0 评论 262 点赞

我是靠谱客的博主轻松小霸王，这篇文章主要介绍深入聊聊mysql索引为什么采用B+树结构，现在分享给大家，希望可以做个参考。

本篇文章是mysql的进阶学习，介绍一下mysql使用B+树作为索引数据结构的原因，希望对大家有所帮助！

索引提高查询效率，就像我们看的书，想要直接翻到某一章，是不是不用一页一页的翻，只需要看下目录，根据目录找到其所在的页数即可。【相关推荐：mysql视频教程】

在计算机中我们需要一种数据结构来存储这个目录，常见数据结构有哈希表，二叉查找树，二叉平衡树(AVL)，红黑树，那为什么Innodb和MyISAM选择b+树呢。

1. 哈希表

缺点：

利用hash存储需要将所有的数据文件添加到内存，比较消耗内存空间。
hash的查找是等值查询，速度很快，但是各个数据间没有范围规律，但在实际工作中更多的是范围查询，hash就不太合适了。

不能直接说mysql不使用哈希表，而是要根据存储引擎来确定的，Memory存储引擎使用的就是哈希表

2. 二叉查找树

缺点：

如图，极端情况可能会出现倾斜的问题，最后变成链表结构。
造成树节点过深，从而增加查找的IO，而现在IO就是查找的瓶颈

3. 二叉平衡树-AVL

缺点：

1.当数据量很大的时候，为了保持平衡，需要进行1-n次的旋转，这个旋转是比较浪费性能的，插入和删除效率极低，查询效率很高。

只有两个分支，数据量大的时候树的深度依然很深。

4. 红黑树

缺点：

同样是只有两个分支，数据量大的时候深度依然会很深

以上三种二叉树，随着数据的增多，最终都会出现节点过多的情况，而且他们有且仅有2个分支，那么IO的次数一样很多.

怎么解决仅有2个分支而且深度过深，这就有了B树，增加分支

5. B-Tree

如上图：（图中只是画出来一部分，实际上没有限制的，不止p1,p2,p3）

每个节点占用一个磁盘块，一个节点上有两个升序排列的关键字和三个指向子树根节点的指针，指针存储的是子节点所在的磁盘块地址。两个关键词划分成的三个范围域对应三个指针指向的子树的数据的范围域。以根节点为例，关键字为16和34，p1指针指向的子树的数据范围小于16，p2指针指向的子树的数据范围为16-34，p3指针指向的子树的数据范围大于34。

查找关键字28的过程：