大家应该都学过平衡二叉树 (AVLTree),了解到 AVL 树的性质,其实平衡二叉树最大的作用就是查找,AVL 树的查找、插入和删除在平均和最坏情况下都是 O(logn)。AVL 树的效率就是高在这个地方。如果在 AVL 树中插入或删除节点后,使得高度之差大于 1。此时,AVL 树的平衡状态就被破坏,它就不再是一棵二叉树;为了让它重新维持在一个平衡状态,就需要对其进行旋转处理, 那么创建一颗平衡二叉树的成本其实不小. 这个时候就有人开始思考,并且提出了红黑树的理论,红黑树在业界应用很广泛,比如 Java 中的 TreeMap,JDK 1.8 中的 HashMap、C++ STL 中的 map 均是基于红黑树结构实现的。那么红黑树到底比 AVL 树好在哪里?

**一、**红黑树简介

红黑树是一种自平衡的二叉查找树,是一种高效的查找树。它是由 Rudolf Bayer 于 1978 年发明,在当时被称为平衡二叉 B 树 (symmetric binary B-trees)。后来,在 1978 年被 Leo J. Guibas 和 Robert Sedgewick 修改为如今的红黑树。红黑树具有良好的效率,它可在 O(logN) 时间内完成查找、增加、删除等操作。

二、为什么需要红黑树?

对于二叉搜索树,如果插入的数据是随机的,那么它就是接近平衡的二叉树,平衡的二叉树,它的操作效率(查询,插入,删除)效率较高,时间复杂度是 O(logN)。但是可能会出现一种极端的情况,那就是插入的数据是有序的(递增或者递减),那么所有的节点都会在根节点的右侧或左侧,此时,二叉搜索树就变为了一个链表,它的操作效率就降低了,时间复杂度为 O(N),所以可以认为二叉搜索树的时间复杂度介于 O(logN)和 O(N) 之间,视情况而定。那么为了应对这种极端情况,红黑树就出现了,它是具备了某些特性的二叉搜索树,能解决非平衡树问题,红黑树是一种接近平衡的二叉树(说它是接近平衡因为它并没有像 AVL 树的平衡因子的概念,它只是靠着满足红黑节点的 5 条性质来维持一种接近平衡的结构,进而提升整体的性能,并没有严格的卡定某个平衡因子来维持绝对平衡)。

三、红黑树的特性

在讲解红黑树性质之前,先简单了解一下几个概念:

  • parent:父节点
  • sibling:兄弟节点
  • uncle:叔父节点( parent 的兄弟节点)
  • grand:祖父节点( parent 的父节点)

首先,红黑树是一个二叉搜索树,它在每个节点增加了一个存储位记录节点的颜色,可以是 RED, 也可以是 BLACK;通过任意一条从根到叶子简单路径上颜色的约束,红黑树保证最长路径不超过最短路径的二倍,因而近似平衡(最短路径就是全黑节点,最长路径就是一个红节点一个黑节点,当从根节点到叶子节点的路径上黑色节点相同时,最长路径刚好是最短路径的两倍)。它同时满足以下特性:

  1. 节点是红色黑色
  2. 根是黑色
  3. 叶子节点(外部节点,空节点)都是**黑色,**这里的叶子节点指的是最底层的空节点(外部节点),下图中的那些 null 节点才是叶子节点,null 节点的父节点在红黑树里不将其看作叶子节点
  4. 红色节点的子节点都是黑色
    1. 红色节点的父节点都是黑色
    2. 从根节点到叶子节点的所有路径上不能有 2 个连续的红色节点
  5. 从任一节点到叶子节点的所有路径都包含相同数目的黑色节点

根据上面的性质,我们来判断一下下面这课树是不是红黑树

上面这棵树首先很容易就能知道是满足性质 1-4 条的,关键在于第 5 条性质,可能乍一看好像也是符合第 5 条的,但实际就会陷入一个误区,直接将图上的最后一层的节点看作叶子节点,这样看的话每一条从根节点到叶子结点的路径确实都经过了 3 个黑节点。

但实际上,在红黑树中真正被定义为叶子结点的,是那些空节点,如下图。

这样一来,路径 1 有 4 个黑色节点(算上空节点),路径 2 只有 3 个黑色节点,这样性质 5 就不满足了,所以这棵树并不是一个红黑树节点。

注:下面的讲解图中将省略红黑树的 null 节点,请自行脑补

四、红黑树的效率

4.1 红黑树效率

红黑树的查找,插入和删除操作,时间复杂度都是 O(logN)。

查找操作时,它和普通的相对平衡的二叉搜索树的效率相同,都是通过相同的方式来查找的,没有用到红黑树特有的特性。

但如果插入的时候是有序数据,那么红黑树的查询效率就比二叉搜索树要高了,因为此时二叉搜索树不是平衡树,它的时间复杂度 O(N)。

插入和删除操作时,由于红黑树的每次操作平均要旋转一次和变换颜色,所以它比普通的二叉搜索树效率要低一点,不过时间复杂度仍然是 O(logN)。总之,红黑树的优点就是对有序数据的查询操作不会慢到 O(logN) 的时间复杂度。

4.2 红黑树和 AVL 树的比较

  1. AVL 树的时间复杂度虽然优于红黑树,但是对于现在的计算机,cpu 太快,可以忽略性能差异
  2. 红黑树的插入删除比 AVL 树更便于控制操作
  3. 红黑树整体性能略优于 AVL 树(红黑树旋转情况少于 AVL 树)

五、红黑树的等价变换

上面这颗红黑树,我们来将所有的红色节点上移到和他们的父节点同一高度上,就会形成如下结构

这个结构很明显,就是一棵四阶 B 树(一个节点最多放三个数据),如果画成如下的样子大家应该就能看的更清晰了。

由上面的等价变换我们就可以得到如下结论:

  1. 红黑树 和 4 阶 B 树(2-3-4 树)具有等价性
  2. 黑色节点与它的红色子节点融合在一起,形成 1 个 B 树节点
  3. 红黑树的黑色节点个数 与 4 阶 B 树的节点总个数相等
  4. 在所有的 B 树节点中,永远是黑色节点是父节点,红色节点是子节点。黑色节点在中间,红色节点在两边。

我们可以利用四阶 B 树与红黑树等价的性质,以红黑树转换成 B 树之后的节点情况来进行一个分类

六、红黑树的操作

红黑树的基本操作和其他树形结构一样,一般都包括查找、插入、删除等操作。前面说到,红黑树是一种自平衡的二叉查找树,既然是二叉查找树的一种,那么查找过程和二叉查找树一样,比较简单,这里不再赘述。相对于查找操作,红黑树的插入和删除操作就要复杂的多。尤其是删除操作,要处理的情况比较多,下面就来分情况讲解。

6.1* 旋转操作

在分析插入和删除操作前,先说明一下旋转操作,这个操作在后续操作中都会用得到。旋转操作分为左旋和右旋,左旋是将某个节点旋转为其右孩子的左孩子,而右旋是节点旋转为其左孩子的右孩子。这话听起来有点绕,所以还是请看下图:

上图包含了左旋和右旋的示意图,这里以右旋为例进行说明,右旋节点 M 的步骤如下:

  1. 将节点 M 的左孩子引用指向节点 E 的右孩子
  2. 将节点 E 的右孩子引用指向节点 M,完成旋转

旋转操作本身并不复杂,上面分析了右旋操作,左旋操作与此类似,只是右旋转的逆操作。

6.2 插入操作

红黑树的插入过程和二叉查找树插入过程基本类似,不同的地方在于,红黑树插入新节点后,需要进行调整,以满足红黑树的性质。

性质 1 规定红黑树节点的颜色要么是红色要么是黑色,那么在插入新节点时,这个节点应该是红色还是黑色呢?答案是红色,原因也不难理解。如果插入的节点是黑色,那么这个节点所在路径比其他路径多出一个黑色节点,这个调整起来会比较麻烦(参考红黑树的删除操作,就知道为啥多一个或少一个黑色节点时,调整起来这么麻烦了)。如果插入的节点是红色,此时所有路径上的黑色节点数量不变,仅可能会出现两个连续的红色节点的情况。这种情况下,通过变色和旋转进行调整即可,比之前的简单多了。所以插入的时候将节点设置为红色,可以保证满足性质 1、2、3、5 ,只有性质 4 不一定满足,需要进行相关调整。如果是添加根节点,则将节点设定为黑色。

6.2.1 插入操作的所有情况

我们在分析红黑树各种插入情况的时候,将其等价转换为 B 树,这样我们能够更直观的进行分类,首先确定几条性质:

  • B 树中,新元素必定是添加到叶子节点中(最底层的节点)
  • 4 阶 B 树所有节点的元素个数 x 都符合 1 ≤ x ≤ 3

在上一章节红黑树的等价变换中,我们讲到了红黑树转换成 B 树总共有四种情况,也就是上图中叶子节点这四种情况,那么在我们进行插入操作的时候,会将节点插入到所有的叶子节点中,总共就会有 12 种情况,其中四种情况满足红黑树的性质,8 种情况不满足红黑树性质。

6.2.1.1 满足红黑树性质 4

有 4 种情况满足红黑树的性质 4 :parent 为黑色节点。这四种情况不需要做任何额外的处理。

6.2.1.2 不满足红黑树性质 4

有 8 种情况不满足红黑树的性质 4 :parent 为红色节点( Double Red ),其中左面 4 种属于 B 树节点上溢的情况(一个 4 阶 B 树节点中最多存放三个数,这四种情况本来已经有 3 个了,又插入了 1 个,变成了 4 个,超出了 4 阶 B 树节点的容量范围,这种情况称为上溢)。这八种情况需要进行额外的处理。

6.2.2 LL RR 插入情况

如上图,插入 52 和 60 的位置分别是 RR 情况和 LL 情况。

RR 情况:父节点为祖父节点的右节点,插入节点为父节点的右节点

LL 情况:父节点为祖父节点的左节点,插入节点为父节点的左节点

这两种情况很明显,插入节点为红色,父节点也为红色,父节点的子节点为红色显然违背了红黑树的性质四,我们需要对这种情况进行修复,使其重新满足红黑树性质。

判定条件: uncle 不是红色节点。

这里的两种情况,他们的插入节点都是没有叔父节点的,所以叔父节点也不可能是红色。

案例修复:

我们在红黑树等价转换那一章节也讲过了,红黑树等价转换成 B 树之后,B 树节点的中间节点(父节点)都是黑色,两边的节点(子节点)都是红色。但是上面两种情况插入后,插入位置的 B 树节点并不满足这个条件,所以我们对其进行修复,使其满足 B 树节点的条件之后,也就重新恢复了红黑树性质。

B 树节点中的中间节点大小介于两个子节点之间。以上图 RR 情况为例,插入节点 52 的原父节点应该放在 B 树节点中间的位置,应当将其染成黑色。插入节点 52 的原祖父节点 46,应当将其转换为插入节点原父节点的子节点,所以将其染成红色。LL 情况同理

完成染色之后,需要对原祖父节点进行单旋操作,来进行父节点,子节点的重新分配。以上图为例:

  • RR 情况应该原祖父节点 46 左旋,将插入节点的原父节点 50 旋转到中间的位置。
  • LL 情况应当原祖父节点 76 右旋,将插入节点的原父节点 72 旋转到中间的位置。

修复之后的结果如下图:

修复步骤总结:

  1. parent 染成黑色,grand 染成红色
  2. grand 进行单旋操作
    1. LL:右旋转
    2. RR:左旋转

6.2.3 LR RL 插入情况

如上图,插入 48 和 74 的位置分别是 RL 情况和 LR 情况。

RL 情况:父节点为祖父节点的右节点,插入节点为父节点的左节点

LR 情况:父节点为祖父节点的左节点,插入节点为父节点的右节点

这两种情况和上面的两种情况一样,插入节点为红色,父节点也为红色,父节点的子节点为红色显然违背了红黑树的性质四,我们需要对这种情况进行修复,使其重新满足红黑树性质。

**判定条件:**uncle 不是红色节点。

这两种情况的插入节点也是没有叔父节点的。

案例修复:

B 树节点中的中间节点大小介于两个子节点之间。以上图 RL 情况为例,插入节点 48 大小介于原父节点和原祖父节点之间,它应该是 B 树节点中的中间节点,所以将插入节点 48 染成黑色,将原祖父节点 46 染成红色来作为插入节点的子节点。LR 情况同理

完成染色之后,需要进行双旋操作,来进行父节点,子节点的重新分配。以上图为例:

  • RL 情况应该原父节点 50 右旋,将插入节点 48 上移到原父节点 50 的高度,然后将插入节点的原祖父节点 46 进行左旋,将插入节点 48 移动到中间位置,成为中间节点。
  • LR 情况应该原父节点 72 左旋,将插入节点 74 上移到原父节点 72 的高度,然后将插入节点的原祖父节点 76 进行右旋,将插入节点 74 移动到中间位置,成为中间节点。

修复之后的结果如下图:

修复步骤总结:

  1. 插入节点染成黑色,grand 染成红色
  2. 进行双旋操作
    • LR:parent 左旋转, grand 右旋转
    • RL:parent 右旋转, grand 左旋转

6.2.4 上溢的 LL 插入情况

如上图,插入 10 的位置是上溢的 LL 情况。

上溢 LL 情况:父节点为祖父节点的左节点,插入节点为父节点的左节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。

这种情况和之前非上溢的四种情况一样,插入节点为红色,父节点也为红色,父节点的子节点为红色显然违背了红黑树的性质四,我们需要对这种情况进行修复,使其重新满足红黑树性质。

判定条件: uncle 是红色节点。满足这个条件的就都是上溢的情况,上溢的修复只需要染色,不需要旋转。

案例修复:

像这种上溢的情况,就需要从溢出的 B 树节点中选出一个节点进行向上合并,选择 B 树节点中中间的树去进行向上合并,这里中间的两个节点就是原父节点 17 和原祖父节点 25,选这两个哪一个向上合并都是对的,但是我们最好选择以后方便操作的,很显然,应该选择原祖父节点 25 来进行向上合并,因为向上合并就是和最上层的 38 和 55 来组合成新的 B 树节点,向上合并的节点肯定是一个子节点,需要与上层相连,而原祖父节点 25 本身就已经和上层连接了,相对更加方便后续的操作。原祖父节点向上合并后,将其染成红色。

原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 17 和插入节点 10 形成一个子树,原叔父节点 33 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原父节点作为中间节点,染成黑色,右边的子树由原叔父节点作为中间节点,染成黑色。

修复之后的结果如下图:

修复步骤总结:

  1. parent、uncle 染成黑色
  2. grand 向上合并
    1. 将向上合并的 grand 染成红色,相对上一层,就当做是新添加的节点,再次来一遍插入情况的判断,进行处理。

grand 向上合并时,可能继续发生上溢。这种情况就继续递归调用修复方法就可以了。若上溢持续到根节点,只需将根节点染成黑色即可(这个意思就是说断向上上溢,一直上溢到了 B 树的根节点位置了,只需要将向上合并的节点变成黑色作为红黑树的根节点即可。因为从 B 树根节点选择出来上溢的节点,肯定就是作为整个红黑树的根节点了)。

6.2.5 上溢的 RR 插入情况

如上图,插入 36 的位置是上溢的 RR 情况。

上溢 RR 情况:父节点为祖父节点的右节点,插入节点为父节点的右节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。

**判定条件:**uncle 是红色节点

案例修复:

上溢 RR 情况的修复,和上溢 LL 情况基本一致,只是修复的位置不同,这里中间的两个节点就是原父节点 33 和原祖父节点 25,选择原祖父节点 25 来进行向上合并,原祖父节点向上合并后,将其染成红色。

原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 33 和插入节点 36 形成一个子树,原叔父节点 17 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原叔父节点作为中间节点,染成黑色,右边的子树由原父节点作为中间节点,染成黑色。

修复之后的结果如下图:

修复步骤总结:

  1. parent、uncle 染成黑色
  2. grand 向上合并
    • 染成红色(其实染成红色就已经是完成了向上合并,因为祖父节点和祖父节点的父节点的连接指向并没有变),当做是新添加的节点进行处理

6.2.6 上溢的 LR 插入情况

如上图,插入 20 的位置是上溢的 LR 情况。

上溢 LR 情况:父节点为祖父节点的左节点,插入节点为父节点的右节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。

判定条件: uncle 是红色节点

案例修复:

上溢 LR 情况的修复,和其他上溢情况基本一致,只是修复的位置不同,这里中间的两个节点就是原父节点 17 和原祖父节点 25,选择原祖父节点 25 来进行向上合并,原祖父节点向上合并后,将其染成红色。

原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 17 和插入节点 20 形成一个子树,原叔父节点 33 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原父节点作为中间节点,染成黑色,右边的子树由原叔父节点作为中间节点,染成黑色。

修复之后的结果如下图:

修复步骤总结:

  1. parent、uncle 染成黑色
  2. grand 向上合并
    • 染成红色,当做是新添加的节点进行处理

6.2.7 上溢的 RL 插入情况

如上图,插入 30 的位置是上溢的 RL 情况。

上溢 RL 情况:父节点为祖父节点的右节点,插入节点为父节点的左节点。并且构成的新的 B 树节点已经超过了 B 树节点容量大小范围。

判定条件: uncle 是红色节点

案例修复:

上溢 RL 情况的修复,和其他上溢情况基本一致,只是修复的位置不同,这里中间的两个节点就是原父节点 33 和原祖父节点 25,选择原祖父节点 25 来进行向上合并,原祖父节点向上合并后,将其染成红色。

原祖父节点 25 向上合并后,它原来左右两边的节点需要分裂成两个子树,也就是原父节点 33 和插入节点 30 形成一个子树,原叔父节点 17 形成一个子树。这两个分裂形成的树都是以后 25 的子树。左边的子树由原叔父节点作为中间节点,染成黑色,右边的子树由原父节点作为中间节点,染成黑色。

修复之后的结果如下图:

修复步骤总结:

  1. parent、uncle 染成黑色
  2. grand 向上合并
    • 染成黑色,当做是新添加的节点进行处理

6.2.8 插入情况总结

插入一共有 12 种情况:

  1. 插入节点的父节点是黑色的情况有 4 种 这种情况仍然会维持红黑树的性质,则不需要进行额外处理。
  2. 插入节点的父节点是红色的情况有 8 种 这种情况不满足红黑树的性质 4,需要进行额外的修复处理。 这 8 种情况中:
    1. 叔父节点不是红色的情况有 4 种 这些情况都是非上溢,需要通过重新染色和旋转来进行修复
    2. 叔父节点是红色的情况有 4 种 这些情况都是上溢的,只需要通过祖父节点上溢合并和染色即可完成修复

6.3 删除 操作

相较于插入操作,红黑树的删除操作则要更为复杂一些。B 树中,最后真正被删除的元素都在叶子节点中。所以在红黑树中,被删除的节点一定也在最后一层。

6.3.1 删除****操作的所有情况

上面我们说删除节点一定都在最后一层,最后一层有红色节点和黑色节点,我们就以删除节点的颜色来区分删除操作的所有情况。

6.3.1.1 删除红色节点

如果删除的节点是红色直接删除,不用作任何调整。因为删除最后一层的红色节点,并没有影响红黑树的任何性质。

6.3.1.2 删除黑色节点

有 3 种情况:

  1. 拥有 2 个红色子节点的黑色节点
    • 不可能被直接删除,因为会找它的子节点替代删除,因此不用考虑这种情况
  2. 拥有 1 个红色子节点的黑色节点
  3. 黑色叶子节点

6.3.2 删除拥有 1 红色子节点的黑色节点

删除拥有 1 个红色子节点的黑色节点的情况,是需要我们做相关的处理的。这里删除的就是节点 46 和 76,他们只有一个红色子节点。

对于一个二叉树来说,删除一个度为 1 的节点(度指的是一个节点的子节点个数),将其删除后需要用它唯一的子节点来进行替换。而红黑树的这种情况的判定条件,就是判定要替代删除节点的子节点是不是红色

判定条件: 用以替代的子节点是红色节点

案例修复:

删除黑色节点 46 和 76

第一步:

将 46 与父节点的连接断开

第二步:

46 唯一的红色子节点 50 作为代替 46 的节点,将其与 46 的父节点进行连接

第三步:

断开 46 与 50 的连接,将 46 删除

删除节点 76 的过程与删除节点 46 相同

第一步:

第二步:

第三步:

但是现在我们发现,80 是红色节点,它的子节点 72 还是红色节点,这样明显不符合红黑树的性质,还需要进一步修复。

将替代的子节点染成黑色即可保持红黑树性质,修复完成

修复步骤总结:

  1. 用删除节点的唯一子节点对其进行替代
  2. 将替代节点染成黑色

6.3.3 删除黑色叶子节点**——**删除节点为根节点

一棵红黑树只有一个黑色根节点(也就是唯一的一个叶子节点,整个红黑树只有这一个黑色节点),可直接删除该节点,无需做其他操作。

6.3.4 删除黑色叶子节点**——**删除节点的兄弟节点为黑色

讲这种删除情况前先举一个例子

上面这个我们要删除节点 88,该节点为黑色叶子节点,它的兄弟节点是黑色 76。从 B 树的角度来看,如果删除 88,因为四阶 B 树的节点中最少存有 1 个元素,如果不足,则会造成下溢。也就是需要从 88 的兄弟节点中借一个子节点出来。这就是这一节我们讨论的删除情况的核心修复思想。

6.3.4.1 兄弟节点至少有 1 红色子节点

下面三个图分别对应着兄弟节点至少有一个红色子节点的三种情况。删除节点为 88,为黑色叶子节点,它的兄弟节点是 76,为黑色。兄弟节点 76 都至少有一个红色子节点,三种情况分别为 76 拥有一个红色右子节点,76 拥有一个红色左子节点,76 拥有两个红色子节点。因为兄弟节点有红色子节点,所以可以借出一个节点来进行修复。

这三种情况,黑色叶子节点被删除后,会导致 B 树节点下溢(比如删除 88),就可以从兄弟节点中借出一个红色子节点来进行修复。

**判定条件:**兄弟节点至少有 1 个红色子节点

案例修复:

1、兄弟节点有一个右子节点:

先将 88 节点删除

删掉之后,从 B 树的角度来看就出现了下溢,这个时候就需要父节点下来,在兄弟节点的子结点中找一个,将他升上去代替。具体的实现就是要对节点进行旋转。

我们可以看出,80、76、78 组成的树是一个 LR 的情况,先对 76 进行左旋转(可以将 76 看作父节点),这样 78 就上去了,再对 80 进行右旋转(可以将 80 看成祖父节点),80 就下去了。

旋转完了之后,如上图。将旋转完之后的中心节点(就是 78、76、80 组成的树的最中心的节点,这里就是 78)进行重新染色,继承删除节点的父节点 80 的颜色。最后再将 78、76、80 组成的树的左右两个节点染成黑色即可完成修复。

2、兄弟节点有一个左子节点:

先将 88 节点删除

删掉之后,从 B 树的角度来看就出现了下溢,这个时候就需要父节点下来,在兄弟节点的子结点中找一个,将他升上去代替。具体的实现就是要对节点进行旋转。

我们可以看出,80、76、72 组成的树是一个 LL 的情况,直接对 80 进行右旋(将 80 看成是祖父节点)。

旋转完了之后,如上图。将旋转完之后的中心节点(就是 76、72、80 组成的树的最中心的节点,这里就是 76)进行重新染色,继承删除节点的父节点 80 的颜色。最后再将 76、72、80 组成的树的左右两个节点染成黑色即可完成修复。

3、兄弟节点有两个左右子节点:

先将 88 节点删除

删除之后,其实可以有两种旋转可以进行修复,既可以使用 LL 方式进行旋转,也可以使用 LR 方式进行旋转。但是因为 LL 方式只需要旋转一次,我们就选用 LL 方式。

直接对 80 进行右旋

旋转完了之后,如上图。将旋转完之后的中心节点(就是 78、72、76、80 组成的树的最中心的节点,这里就是 76)进行重新染色,继承删除节点的父节点 80 的颜色。最后再将 78、72、76、80 组成的树的左右两个节点染成黑色即可完成修复。

修复步骤总结:

  1. 进行旋转操作
  2. 旋转之后的中心节点继承父节点(删除节点的父节点)的颜色
  3. 旋转之后的左右节点染为黑色

6.3.4.2 兄弟节点没有红色子节点

当删除节点的兄弟节点没有红色节点可以借出的情况下,就需要父节点来向下合并进行修复,父节点向下和兄弟节点合并成新的 B 树节点来解决下溢。

**判定条件:**兄弟节点没有 1 个红色子节点

案例修复:

1、父节点为红色:

删除节点 88,出现下溢

因为兄弟节点 76 没有可以借出的红色节点,所以需要父节点 80 来向下与 76 合并进行修复

将兄弟节点 76 染成红色,父节点 80 染成黑色即可完成修复

2、父节点为黑色:

删除节点 88,删除之后节点 88 就会出现下溢

删除之后父节点 80 应该向下合并进行修复,但是因为父节点 80 为黑色,如果向下合并之后,其实就相当于 80 这个节点也出现了下溢。

这个时候只需要把父节点当作被删除的节点进行处理即可

修复步骤总结:

  1. 父节点向下与兄弟节点进行合并
  2. 将兄弟染成红色、父节点染成黑色即可修复红黑树性质
    • 如果父节点是黑色,直接将父节点当成被删除的节点处理,来修复父节点的下溢情况

6.3.5 删除黑色叶子节点**——**删除节点的兄弟节点为红色

如果删除节点的兄弟节点为红色,这样删除节点出现下溢后没办法通过兄弟节点来进行修复。这就需要先把红黑树转换为兄弟节点为黑色的情况,就可以套用上面讲的修复方法来进行修复了。

**判定条件:**兄弟节点是红色

案例修复:

删除 88 节点之前,需要先转换成兄弟节点为黑色的情况,当前 88 的兄弟节点是红色 55。可以将其看作 LL 情况,对父节点 88 进行右旋转,这样 55 就被移动上去了,成了 80 的父节点。76 也被移动上去了,成了 80 的子节点。

这种情况,删除节点 88 的兄弟节点就变成了黑色,并且没有红色子节点,可以继续套用之前讲的方法来进行修复了。

删除掉 88,将 80 染成黑色,76 染成红色,完成修复。

修复步骤总结:

  1. 兄弟节点染成 BLACK,父节点染成染成 RED,对父节点进行右旋
  2. 于是又回到兄弟节点是黑色的情况(侄子节点变为兄弟节点),继续使用兄弟节点为黑色的方法进行修复

七、红黑树的平衡

AVL 是靠平衡因子来保持平衡的,比如平衡因子为 1,那么左右子树的高度差就不能超过 1,是一种强平衡。

对于红黑树而言,为何那 5 条性质,就能保证红黑树是平衡的?

  • 因为那 5 条性质,可以保证红黑树等价于 4 阶 B 树

B 树比较矮,它本身就是平衡的,高度越小越平衡。

红黑树就是能保证这个树高度不会特别高,红黑树的最大高度是 2 ∗ log2(n + 1) ,依然是 O(logn) 级别,因为高度不会很大进而维持一种相对平衡的状态。相比 AVL 树,红黑树的平衡标准比较宽松:没有一条路径会大于其他路径的 2 。这是是一种弱平衡、黑高度平衡(黑高度只算黑色节点个数,红黑树的任何一条路径的黑色节点数一样,则黑高度都是一样)。

八、红黑树的平均时间复杂度

  • 搜索:O(logn)
  • 添加:O(logn),O(1) 次的旋转操作
  • 删除:O(logn),O(1) 次的旋转操作

**九、**AVL vs 红黑树

9.1 AVL

  • 平衡标准比较严格:每个左右子树的高度差不超过 1
  • 最大高度是 1.44 ∗ log2 n + 2 − 1.328(100W 个节点,AVL 树最大树高 28)
  • 搜索、添加、删除都是 O(logn) 复杂度,其中添加仅需 O(1) 次旋转调整、删除最多需要 O(logn) 次旋转调整

9.2 红黑树

  • 平衡标准比较宽松:没有一条路径会大于其他路径的 2 倍
  • 最大高度是 2 ∗ log2(n + 1)( 100W 个节点,红黑树最大树高 40)
  • 搜索、添加、删除都是 O(logn) 复杂度,其中添加、删除都仅需 O(1) 次旋转调整

9.3 如何选择

  • 搜索的次数远远大于插入和删除,选择 AVL 树;搜索、插入、删除次数几乎差不多,选择红黑树
  • 相对于 AVL 树来说,红黑树牺牲了部分平衡性以换取插入 / 删除操作时少量的旋转操作,整体来说性能要优于 AVL 树
  • 红黑树的平均统计性能优于 AVL 树,实际应用中更多选择使用红黑树

9.4 案例对比

10, 35, 47, 11, 5, 57, 39, 14, 27, 26, 84, 75, 63, 41, 37, 24, 96 组成一棵树

9.4.1 二叉搜索树

非常不平衡

9.4.2 AVL

最平衡

9.4.3 红黑树

相对比较平衡

相关文章:【Java 集合】HashMap 系列(一)——底层数据结构分析                   【Java 集合】HashMap 系列(二)——底层源码分析                   【Java 集合】HashMap 系列(三)——TreeNode 内部类源码分析                   【Java 集合】一文快速了解 HashMap 底层原理