大家应该都学过平衡二叉树 (AVLTree),了解到 AVL 树的性质,其实平衡二叉树最大的作用就是查找,AVL 树的查找、插入和删除在平均和最坏情况下都是 O(logn)。AVL 树的效率就是高在这个地方。如果在 AVL 树中插入或删除节点后,使得高度之差大于 1。此时,AVL 树的平衡状态就被破坏,它就不再是一棵二叉树;为了让它重新维持在一个平衡状态,就需要对其进行旋转处理, 那么创建一颗平衡二叉树的成本其实不小. 这个时候就有人开始思考,并且提出了红黑树的理论,红黑树在业界应用很广泛,比如 Java 中的 TreeMap,JDK 1.8 中的 HashMap、C++ STL 中的 map 均是基于红黑树结构实现的。那么红黑树到底比 AVL 树好在哪里?
**一、**红黑树简介
红黑树是一种自平衡的二叉查找树,是一种高效的查找树。它是由 Rudolf Bayer 于 1978 年发明,在当时被称为平衡二叉 B 树 (symmetric binary B-trees)。后来,在 1978 年被 Leo J. Guibas 和 Robert Sedgewick 修改为如今的红黑树。红黑树具有良好的效率,它可在 O(logN) 时间内完成查找、增加、删除等操作。
二、为什么需要红黑树?
对于二叉搜索树,如果插入的数据是随机的,那么它就是接近平衡的二叉树,平衡的二叉树,它的操作效率(查询,插入,删除)效率较高,时间复杂度是 O(logN)。但是可能会出现一种极端的情况,那就是插入的数据是有序的(递增或者递减),那么所有的节点都会在根节点的右侧或左侧,此时,二叉搜索树就变为了一个链表,它的操作效率就降低了,时间复杂度为 O(N),所以可以认为二叉搜索树的时间复杂度介于 O(logN)和 O(N) 之间,视情况而定。那么为了应对这种极端情况,红黑树就出现了,它是具备了某些特性的二叉搜索树,能解决非平衡树问题,红黑树是一种接近平衡的二叉树(说它是接近平衡因为它并没有像 AVL 树的平衡因子的概念,它只是靠着满足红黑节点的 5 条性质来维持一种接近平衡的结构,进而提升整体的性能,并没有严格的卡定某个平衡因子来维持绝对平衡)。
三、红黑树的特性
在讲解红黑树性质之前,先简单了解一下几个概念:
- parent:父节点
- sibling:兄弟节点
- uncle:叔父节点( parent 的兄弟节点)
- grand:祖父节点( parent 的父节点)
首先,红黑树是一个二叉搜索树,它在每个节点增加了一个存储位记录节点的颜色,可以是 RED, 也可以是 BLACK;通过任意一条从根到叶子简单路径上颜色的约束,红黑树保证最长路径不超过最短路径的二倍,因而近似平衡(最短路径就是全黑节点,最长路径就是一个红节点一个黑节点,当从根节点到叶子节点的路径上黑色节点相同时,最长路径刚好是最短路径的两倍)。它同时满足以下特性:
- 节点是红色或黑色
- 根是黑色
- 叶子节点(外部节点,空节点)都是**黑色,**这里的叶子节点指的是最底层的空节点(外部节点),下图中的那些 null 节点才是叶子节点,null 节点的父节点在红黑树里不将其看作叶子节点
- 红色节点的子节点都是黑色
- 红色节点的父节点都是黑色
- 从根节点到叶子节点的所有路径上不能有 2 个连续的红色节点
- 从任一节点到叶子节点的所有路径都包含相同数目的黑色节点
根据上面的性质,我们来判断一下下面这课树是不是红黑树
上面这棵树首先很容易就能知道是满足性质 1-4 条的,关键在于第 5 条性质,可能乍一看好像也是符合第 5 条的,但实际就会陷入一个误区,直接将图上的最后一层的节点看作叶子节点,这样看的话每一条从根节点到叶子结点的路径确实都经过了 3 个黑节点。
但实际上,在红黑树中真正被定义为叶子结点的,是那些空节点,如下图。
这样一来,路径 1 有 4 个黑色节点(算上空节点),路径 2 只有 3 个黑色节点,这样性质 5 就不满足了,所以这棵树并不是一个红黑树节点。
注:下面的讲解图中将省略红黑树的 null 节点,请自行脑补
四、红黑树的效率
4.1 红黑树效率
红黑树的查找,插入和删除操作,时间复杂度都是 O(logN)。
查找操作时,它和普通的相对平衡的二叉搜索树的效率相同,都是通过相同的方式来查找的,没有用到红黑树特有的特性。
但如果插入的时候是有序数据,那么红黑树的查询效率就比二叉搜索树要高了,因为此时二叉搜索树不是平衡树,它的时间复杂度 O(N)。
插入和删除操作时,由于红黑树的每次操作平均要旋转一次和变换颜色,所以它比普通的二叉搜索树效率要低一点,不过时间复杂度仍然是 O(logN)。总之,红黑树的优点就是对有序数据的查询操作不会慢到 O(logN) 的时间复杂度。
4.2 红黑树和 AVL 树的比较
- AVL 树的时间复杂度虽然优于红黑树,但是对于现在的计算机,cpu 太快,可以忽略性能差异
- 红黑树的插入删除比 AVL 树更便于控制操作
- 红黑树整体性能略优于 AVL 树(红黑树旋转情况少于 AVL 树)
五、红黑树的等价变换
上面这颗红黑树,我们来将所有的红色节点上移到和他们的父节点同一高度上,就会形成如下结构
这个结构很明显,就是一棵四阶 B 树(一个节点最多放三个数据),如果画成如下的样子大家应该就能看的更清晰了。
由上面的等价变换我们就可以得到如下结论:
- 红黑树 和 4 阶 B 树(2-3-4 树)具有等价性
- 黑色节点与它的红色子节点融合在一起,形成 1 个 B 树节点
- 红黑树的黑色节点个数 与 4 阶 B 树的节点总个数相等
- 在所有的 B 树节点中,永远是黑色节点是父节点,红色节点是子节点。黑色节点在中间,红色节点在两边。
我们可以利用四阶 B 树与红黑树等价的性质,以红黑树转换成 B 树之后的节点情况来进行一个分类
六、红黑树的操作
红黑树的基本操作和其他树形结构一样,一般都包括查找、插入、删除等操作。前面说到,红黑树是一种自平衡的二叉查找树,既然是二叉查找树的一种,那么查找过程和二叉查找树一样,比较简单,这里不再赘述。相对于查找操作,红黑树的插入和删除操作就要复杂的多。尤其是删除操作,要处理的情况比较多,下面就来分情况讲解。
6.1* 旋转操作
在分析插入和删除操作前,先说明一下旋转操作,这个操作在后续操作中都会用得到。旋转操作分为左旋和右旋,左旋是将某个节点旋转为其右孩子的左孩子,而右旋是节点旋转为其左孩子的右孩子。这话听起来有点绕,所以还是请看下图:
上图包含了左旋和右旋的示意图,这里以右旋为例进行说明,右旋节点 M 的步骤如下:
- 将节点 M 的左孩子引用指向节点 E 的右孩子
- 将节点 E 的右孩子引用指向节点 M,完成旋转
旋转操作本身并不复杂,上面分析了右旋操作,左旋操作与此类似,只是右旋转的逆操作。
6.2 插入操作
红黑树的插入过程和二叉查找树插入过程基本类似,不同的地方在于,红黑树插入新节点后,需要进行调整,以满足红黑树的性质。
性质 1 规定红黑树节点的颜色要么是红色要么是黑色,那么在插入新节点时,这个节点应该是红色还是黑色呢?答案是红色,原因也不难理解。如果插入的节点是黑色,那么这个节点所在路径比其他路径多出一个黑色节点,这个调整起来会比较麻烦(参考红黑树的删除操作,就知道为啥多一个或少一个黑色节点时,调整起来这么麻烦了)。如果插入的节点是红色,此时所有路径上的黑色节点数量不变,仅可能会出现两个连续的红色节点的情况。这种情况下,通过变色和旋转进行调整即可,比之前的简单多了。所以插入的时候将节点设置为红色,可以保证满足性质 1、2、3、5 ,只有性质 4 不一定满足,需要进行相关调整。如果是添加根节点,则将节点设定为黑色。
6.2.1 插入操作的所有情况
我们在分析红黑树各种插入情况的时候,将其等价转换为 B 树,这样我们能够更直观的进行分类,首先确定几条性质:
- B 树中,新元素必定是添加到叶子节点中(最底层的节点)
- 4 阶 B 树所有节点的元素个数 x 都符合 1 ≤ x ≤ 3
在上一章节红黑树的等价变换中,我们讲到了红黑树转换成 B 树总共有四种情况,也就是上图中叶子节点这四种情况,那么在我们进行插入操作的时候,会将节点插入到所有的叶子节点中,总共就会有 12 种情况,其中四种情况满足红黑树的性质,8 种情况不满足红黑树性质。
6.2.1.1 满足红黑树性质 4
有 4 种情况满足红黑树的性质 4 :parent 为黑色节点。这四种情况不需要做任何额外的处理。
6.2.1.2 不满足红黑树性质 4
有 8 种情况不满足红黑树的性质 4 :parent 为红色节点( Double Red ),其中左面 4 种属于 B 树节点上溢的情况(一个 4 阶 B 树节点中最多存放三个数,这四种情况本来已经有 3 个了,又插入了 1 个,变成了 4 个,超出了 4 阶 B 树节点的容量范围,这种情况称为上溢)。这八种情况需要进行额外的处理。
6.2.2 LL 和 RR 插入情况
如上图,插入 52 和 60 的位置分别是 RR 情况和 LL 情况。
RR 情况:父节点为祖父节点的右节点,插入节点为父节点的右节点
LL 情况:父节点为祖父节点的左节点,插入节点为父节点的左节点
这两种情况很明显,插入节点为红色,父节点也为红色,父节点的子节点为红色显然违背了红黑树的性质四,我们需要对这种情况进行修复,使其重新满足红黑树性质。
判定条件: uncle 不是红色节点。
这里的两种情况,他们的插入节点都是没有叔父节点的,所以叔父节点也不可能是红色。
案例修复:
我们在红黑树等价转换那一章节也讲过了,红黑树等价转换成 B 树之后,B 树节点的中间节点(父节点)都是黑色,两边的节点(子节点)都是红色。但是上面两种情况插入后,插入位置的 B 树节点并不满足这个条件,所以我们对其进行修复,使其满足 B 树节点的条件之后,也就重新恢复了红黑树性质。
B 树节点中的中间节点大小介于两个子节点之间。以上图 RR 情况为例,插入节点 52 的原父节点应该放在 B 树节点中间的位置,应当将其染成黑色。插入节点 52 的原祖父节点 46,应当将其转换为插入节点原父节点的子节点,所以将其染成红色。LL 情况同理
完成染色之后,需要对原祖父节点进行单旋操作,来进行父节点,子节点的重新分配。以上图为例:
- RR 情况应该原祖父节点 46 左旋,将插入节点的原父节点 50 旋转到中间的位置。
- LL 情况应当原祖父节点 76 右旋,将插入节点的原父节点 72 旋转到中间的位置。
修复之后的结果如下图:
修复步骤总结:
- parent 染成黑色,grand 染成红色
- grand 进行单旋操作
- LL:右旋转
- RR:左旋转
6.2.3 LR 和 RL 插入情况
如上图,插入 48 和 74 的位置分别是 RL 情况和 LR 情况。
RL 情况:父节点为祖父节点的右节点,插入节点为父节点的左节点
LR 情况:父节点为祖父节点的左节点,插入节点为父节点的右节点
这两种情况和上面的两种情况一样,插入节点为红色,父节点也为红色,父节点的子节点为红色显然违背了红黑树的性质四,我们需要对这种情况进行修复,使其重新满足红黑树性质。
**判定条件:**uncle 不是红色节点。
这两种情况的插入节点也是没有叔父节点的。
案例修复:
B 树节点中的中间节点大小介于两个子节点之间。以上图 RL 情况为例,插入节点 48 大小介于原父节点和原祖父节点之间,它应该是 B 树节点中的中间节点,所以将插入节点 48 染成黑色,将原祖父节点 46 染成红色来作为插入节点的子节点。LR 情况同理
完成染色之后,需要进行双旋操作,来进行父节点,子节点的重新分配。以上图为例:
- RL 情况应该原父节点 50 右旋,将插入节点 48 上移到原父节点 50 的高度,然后将插入节点的原祖父节点 46 进行左旋,将插入节点 48 移动到中间位置,成为中间节点。
- LR 情况应该原父节点 72 左旋,将插入节点 74 上移到原父节点 72 的高度,然后将插入节点的原祖父节点 76 进行右旋,将插入节点 74 移动到中间位置,成为中间节点。
修复之后的结果如下图:
修复步骤总结:
- 插入节点染成黑色,grand 染成红色
- 进行双旋操作
- LR:parent 左旋转, grand 右旋转
- RL:parent 右旋转, grand 左旋转
6.2.4 上溢的 LL 插入情况
如上图,插入 10 的位置是上溢的 LL 情况。
上溢 LL 情况:父节点为祖父节点的左节点,插入节点为父节点的左节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。
这种情况和之前非上溢的四种情况一样,插入节点为红色,父节点也为红色,父节点的子节点为红色显然违背了红黑树的性质四,我们需要对这种情况进行修复,使其重新满足红黑树性质。
判定条件: uncle 是红色节点。满足这个条件的就都是上溢的情况,上溢的修复只需要染色,不需要旋转。
案例修复:
像这种上溢的情况,就需要从溢出的 B 树节点中选出一个节点进行向上合并,选择 B 树节点中中间的树去进行向上合并,这里中间的两个节点就是原父节点 17 和原祖父节点 25,选这两个哪一个向上合并都是对的,但是我们最好选择以后方便操作的,很显然,应该选择原祖父节点 25 来进行向上合并,因为向上合并就是和最上层的 38 和 55 来组合成新的 B 树节点,向上合并的节点肯定是一个子节点,需要与上层相连,而原祖父节点 25 本身就已经和上层连接了,相对更加方便后续的操作。原祖父节点向上合并后,将其染成红色。
原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 17 和插入节点 10 形成一个子树,原叔父节点 33 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原父节点作为中间节点,染成黑色,右边的子树由原叔父节点作为中间节点,染成黑色。
修复之后的结果如下图:
修复步骤总结:
- parent、uncle 染成黑色
- grand 向上合并
- 将向上合并的 grand 染成红色,相对上一层,就当做是新添加的节点,再次来一遍插入情况的判断,进行处理。
grand 向上合并时,可能继续发生上溢。这种情况就继续递归调用修复方法就可以了。若上溢持续到根节点,只需将根节点染成黑色即可(这个意思就是说断向上上溢,一直上溢到了 B 树的根节点位置了,只需要将向上合并的节点变成黑色作为红黑树的根节点即可。因为从 B 树根节点选择出来上溢的节点,肯定就是作为整个红黑树的根节点了)。
6.2.5 上溢的 RR 插入情况
如上图,插入 36 的位置是上溢的 RR 情况。
上溢 RR 情况:父节点为祖父节点的右节点,插入节点为父节点的右节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。
**判定条件:**uncle 是红色节点
案例修复:
上溢 RR 情况的修复,和上溢 LL 情况基本一致,只是修复的位置不同,这里中间的两个节点就是原父节点 33 和原祖父节点 25,选择原祖父节点 25 来进行向上合并,原祖父节点向上合并后,将其染成红色。
原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 33 和插入节点 36 形成一个子树,原叔父节点 17 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原叔父节点作为中间节点,染成黑色,右边的子树由原父节点作为中间节点,染成黑色。
修复之后的结果如下图:
修复步骤总结:
- parent、uncle 染成黑色
- grand 向上合并
- 染成红色(其实染成红色就已经是完成了向上合并,因为祖父节点和祖父节点的父节点的连接指向并没有变),当做是新添加的节点进行处理
6.2.6 上溢的 LR 插入情况
如上图,插入 20 的位置是上溢的 LR 情况。
上溢 LR 情况:父节点为祖父节点的左节点,插入节点为父节点的右节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。
判定条件: uncle 是红色节点
案例修复:
上溢 LR 情况的修复,和其他上溢情况基本一致,只是修复的位置不同,这里中间的两个节点就是原父节点 17 和原祖父节点 25,选择原祖父节点 25 来进行向上合并,原祖父节点向上合并后,将其染成红色。
原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 17 和插入节点 20 形成一个子树,原叔父节点 33 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原父节点作为中间节点,染成黑色,右边的子树由原叔父节点作为中间节点,染成黑色。
修复之后的结果如下图:
修复步骤总结:
- parent、uncle 染成黑色
- grand 向上合并
- 染成红色,当做是新添加的节点进行处理
6.2.7 上溢的 RL 插入情况
如上图,插入 30 的位置是上溢的 RL 情况。
上溢 RL 情况:父节点为祖父节点的右节点,插入节点为父节点的左节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。
判定条件: uncle 是红色节点
案例修复:
上溢 RL 情况的修复,和其他上溢情况基本一致,只是修复的位置不同,这里中间的两个节点就是原父节点 33 和原祖父节点 25,选择原祖父节点 25 来进行向上合并,原祖父节点向上合并后,将其染成红色。
原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 33 和插入节点 30 形成一个子树,原叔父节点 17 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原叔父节点作为中间节点,染成黑色,右边的子树由原父节点作为中间节点,染成黑色。
修复之后的结果如下图:
修复步骤总结:
- parent、uncle 染成黑色
- grand 向上合并
- 染成黑色,当做是新添加的节点进行处理
6.2.8 插入情况总结
插入一共有 12 种情况:
- 插入节点的父节点是黑色的情况有 4 种 这种情况仍然会维持红黑树的性质,则不需要进行额外处理。
- 插入节点的父节点是红色的情况有 8 种
这种情况不满足红黑树的性质 4,需要进行额外的修复处理。
这 8 种情况中:
- 叔父节点不是红色的情况有 4 种 这些情况都是非上溢,需要通过重新染色和旋转来进行修复
- 叔父节点是红色的情况有 4 种 这些情况都是上溢的,只需要通过祖父节点上溢合并和染色即可完成修复
6.3 删除 操作
相较于插入操作,红黑树的删除操作则要更为复杂一些。B 树中,最后真正被删除的元素都在叶子节点中。所以在红黑树中,被删除的节点一定也在最后一层。
6.3.1 删除****操作的所有情况
上面我们说删除节点一定都在最后一层,最后一层有红色节点和黑色节点,我们就以删除节点的颜色来区分删除操作的所有情况。
6.3.1.1 删除红色节点
如果删除的节点是红色直接删除,不用作任何调整。因为删除最后一层的红色节点,并没有影响红黑树的任何性质。
6.3.1.2 删除黑色节点
有 3 种情况:
- 拥有 2 个红色子节点的黑色节点
- 不可能被直接删除,因为会找它的子节点替代删除,因此不用考虑这种情况
- 拥有 1 个红色子节点的黑色节点
- 黑色叶子节点
6.3.2 删除拥有 1 个红色子节点的黑色节点
删除拥有 1 个红色子节点的黑色节点的情况,是需要我们做相关的处理的。这里删除的就是节点 46 和 76,他们只有一个红色子节点。
对于一个二叉树来说,删除一个度为 1 的节点(度指的是一个节点的子节点个数),将其删除后需要用它唯一的子节点来进行替换。而红黑树的这种情况的判定条件,就是判定要替代删除节点的子节点是不是红色
判定条件: 用以替代的子节点是红色节点
案例修复:
删除黑色节点 46 和 76
第一步:
将 46 与父节点的连接断开
第二步:
46 唯一的红色子节点 50 作为代替 46 的节点,将其与 46 的父节点进行连接
第三步:
断开 46 与 50 的连接,将 46 删除
删除节点 76 的过程与删除节点 46 相同
第一步:
第二步:
第三步:
但是现在我们发现,80 是红色节点,它的子节点 72 还是红色节点,这样明显不符合红黑树的性质,还需要进一步修复。
将替代的子节点染成黑色即可保持红黑树性质,修复完成
修复步骤总结:
- 用删除节点的唯一子节点对其进行替代
- 将替代节点染成黑色
6.3.3 删除黑色叶子节点**——**删除节点为根节点
一棵红黑树只有一个黑色根节点(也就是唯一的一个叶子节点,整个红黑树只有这一个黑色节点),可直接删除该节点,无需做其他操作。
6.3.4 删除黑色叶子节点**——**删除节点的兄弟节点为黑色
讲这种删除情况前先举一个例子
上面这个我们要删除节点 88,该节点为黑色叶子节点,它的兄弟节点是黑色 76。从 B 树的角度来看,如果删除 88,因为四阶 B 树的节点中最少存有 1 个元素,如果不足,则会造成下溢。也就是需要从 88 的兄弟节点中借一个子节点出来。这就是这一节我们讨论的删除情况的核心修复思想。
6.3.4.1 兄弟节点至少有 1 个红色子节点
下面三个图分别对应着兄弟节点至少有一个红色子节点的三种情况。删除节点为 88,为黑色叶子节点,它的兄弟节点是 76,为黑色。兄弟节点 76 都至少有一个红色子节点,三种情况分别为 76 拥有一个红色右子节点,76 拥有一个红色左子节点,76 拥有两个红色子节点。因为兄弟节点有红色子节点,所以可以借出一个节点来进行修复。
这三种情况,黑色叶子节点被删除后,会导致 B 树节点下溢(比如删除 88),就可以从兄弟节点中借出一个红色子节点来进行修复。
**判定条件:**兄弟节点至少有 1 个红色子节点
案例修复:
1、兄弟节点有一个右子节点:
先将 88 节点删除
删掉之后,从 B 树的角度来看就出现了下溢,这个时候就需要父节点下来,在兄弟节点的子结点中找一个,将他升上去代替。具体的实现就是要对节点进行旋转。
我们可以看出,80、76、78 组成的树是一个 LR 的情况,先对 76 进行左旋转(可以将 76 看作父节点),这样 78 就上去了,再对 80 进行右旋转(可以将 80 看成祖父节点),80 就下去了。
旋转完了之后,如上图。将旋转完之后的中心节点(就是 78、76、80 组成的树的最中心的节点,这里就是 78)进行重新染色,继承删除节点的父节点 80 的颜色。最后再将 78、76、80 组成的树的左右两个节点染成黑色即可完成修复。
2、兄弟节点有一个左子节点:
先将 88 节点删除
删掉之后,从 B 树的角度来看就出现了下溢,这个时候就需要父节点下来,在兄弟节点的子结点中找一个,将他升上去代替。具体的实现就是要对节点进行旋转。
我们可以看出,80、76、72 组成的树是一个 LL 的情况,直接对 80 进行右旋(将 80 看成是祖父节点)。
旋转完了之后,如上图。将旋转完之后的中心节点(就是 76、72、80 组成的树的最中心的节点,这里就是 76)进行重新染色,继承删除节点的父节点 80 的颜色。最后再将 76、72、80 组成的树的左右两个节点染成黑色即可完成修复。
3、兄弟节点有两个左右子节点:
先将 88 节点删除
删除之后,其实可以有两种旋转可以进行修复,既可以使用 LL 方式进行旋转,也可以使用 LR 方式进行旋转。但是因为 LL 方式只需要旋转一次,我们就选用 LL 方式。
直接对 80 进行右旋
旋转完了之后,如上图。将旋转完之后的中心节点(就是 78、72、76、80 组成的树的最中心的节点,这里就是 76)进行重新染色,继承删除节点的父节点 80 的颜色。最后再将 78、72、76、80 组成的树的左右两个节点染成黑色即可完成修复。
修复步骤总结:
- 进行旋转操作
- 旋转之后的中心节点继承父节点(删除节点的父节点)的颜色
- 旋转之后的左右节点染为黑色
6.3.4.2 兄弟节点没有红色子节点
当删除节点的兄弟节点没有红色节点可以借出的情况下,就需要父节点来向下合并进行修复,父节点向下和兄弟节点合并成新的 B 树节点来解决下溢。
**判定条件:**兄弟节点没有 1 个红色子节点
案例修复:
1、父节点为红色:
删除节点 88,出现下溢
因为兄弟节点 76 没有可以借出的红色节点,所以需要父节点 80 来向下与 76 合并进行修复
将兄弟节点 76 染成红色,父节点 80 染成黑色即可完成修复
2、父节点为黑色:
删除节点 88,删除之后节点 88 就会出现下溢
删除之后父节点 80 应该向下合并进行修复,但是因为父节点 80 为黑色,如果向下合并之后,其实就相当于 80 这个节点也出现了下溢。
这个时候只需要把父节点当作被删除的节点进行处理即可
修复步骤总结:
- 父节点向下与兄弟节点进行合并
- 将兄弟染成红色、父节点染成黑色即可修复红黑树性质
- 如果父节点是黑色,直接将父节点当成被删除的节点处理,来修复父节点的下溢情况
6.3.5 删除黑色叶子节点**——**删除节点的兄弟节点为红色
如果删除节点的兄弟节点为红色,这样删除节点出现下溢后没办法通过兄弟节点来进行修复。这就需要先把红黑树转换为兄弟节点为黑色的情况,就可以套用上面讲的修复方法来进行修复了。
**判定条件:**兄弟节点是红色
案例修复:
删除 88 节点之前,需要先转换成兄弟节点为黑色的情况,当前 88 的兄弟节点是红色 55。可以将其看作 LL 情况,对父节点 88 进行右旋转,这样 55 就被移动上去了,成了 80 的父节点。76 也被移动上去了,成了 80 的子节点。
这种情况,删除节点 88 的兄弟节点就变成了黑色,并且没有红色子节点,可以继续套用之前讲的方法来进行修复了。
删除掉 88,将 80 染成黑色,76 染成红色,完成修复。
修复步骤总结:
- 兄弟节点染成 BLACK,父节点染成染成 RED,对父节点进行右旋
- 于是又回到兄弟节点是黑色的情况(侄子节点变为兄弟节点),继续使用兄弟节点为黑色的方法进行修复
七、红黑树的平衡
AVL 是靠平衡因子来保持平衡的,比如平衡因子为 1,那么左右子树的高度差就不能超过 1,是一种强平衡。
对于红黑树而言,为何那 5 条性质,就能保证红黑树是平衡的?
- 因为那 5 条性质,可以保证红黑树等价于 4 阶 B 树
B 树比较矮,它本身就是平衡的,高度越小越平衡。
红黑树就是能保证这个树高度不会特别高,红黑树的最大高度是 2 ∗ log2(n + 1) ,依然是 O(logn) 级别,因为高度不会很大进而维持一种相对平衡的状态。相比 AVL 树,红黑树的平衡标准比较宽松:没有一条路径会大于其他路径的 2 倍。这是是一种弱平衡、黑高度平衡(黑高度只算黑色节点个数,红黑树的任何一条路径的黑色节点数一样,则黑高度都是一样)。
八、红黑树的平均时间复杂度
- 搜索:O(logn)
- 添加:O(logn),O(1) 次的旋转操作
- 删除:O(logn),O(1) 次的旋转操作
**九、**AVL 树 vs 红黑树
9.1 AVL 树
- 平衡标准比较严格:每个左右子树的高度差不超过 1
- 最大高度是 1.44 ∗ log2 n + 2 − 1.328(100W 个节点,AVL 树最大树高 28)
- 搜索、添加、删除都是 O(logn) 复杂度,其中添加仅需 O(1) 次旋转调整、删除最多需要 O(logn) 次旋转调整
9.2 红黑树
- 平衡标准比较宽松:没有一条路径会大于其他路径的 2 倍
- 最大高度是 2 ∗ log2(n + 1)( 100W 个节点,红黑树最大树高 40)
- 搜索、添加、删除都是 O(logn) 复杂度,其中添加、删除都仅需 O(1) 次旋转调整
9.3 如何选择
- 搜索的次数远远大于插入和删除,选择 AVL 树;搜索、插入、删除次数几乎差不多,选择红黑树
- 相对于 AVL 树来说,红黑树牺牲了部分平衡性以换取插入 / 删除操作时少量的旋转操作,整体来说性能要优于 AVL 树
- 红黑树的平均统计性能优于 AVL 树,实际应用中更多选择使用红黑树
9.4 案例对比
10, 35, 47, 11, 5, 57, 39, 14, 27, 26, 84, 75, 63, 41, 37, 24, 96 组成一棵树
9.4.1 二叉搜索树
非常不平衡
9.4.2 AVL 树
最平衡
9.4.3 红黑树
相对比较平衡
相关文章:【Java 集合】HashMap 系列(一)——底层数据结构分析 【Java 集合】HashMap 系列(二)——底层源码分析 【Java 集合】HashMap 系列(三)——TreeNode 内部类源码分析 【Java 集合】一文快速了解 HashMap 底层原理