C++红黑树详解
文章目录
- 红黑树
- 概念
- 规则
- 为什么最长路径不超过最短路径的二倍?
- 红黑树的时间复杂度
- 红黑树的结构
- 插入
- 叔叔节点情况的讨论
- 只变色(叔叔存在且为红)
- 抽象的情况
- 变色+单旋(叔叔不存在或叔叔存在且为黑)
- 变色+双旋(叔叔不存在或叔叔存在且为黑)
- 判断是不是红黑树
- 代码
红黑树
概念
红黑树保证了最长的路径不超过最短路径的二倍
规则
- 根节点是黑色的
- 每个节点不是红色就是黑色
- 如果有一个节点是红的,那么它的两个孩子都是黑的,就是说一条路径不会有两个连续的红色节点(不会出现红红,其他情况可以出现红黑,黑黑,黑红)
- 对于每个节点到其空节点上的简单路径,每一条路径上都有相同数量的黑色节点
为什么最长路径不超过最短路径的二倍?
- 最短路径就是全黑
- 最长路径就是一黑一红的组合
- 假设每条路径有x个黑色的节点
最短:x
最长:2*x
这是最极端的场景 - 其它的场景都在最短和最长之间
比如下面这幅图:
最短:3
最长:4
最长路径不超过最短路径的2倍
路径的条数(要算到走到空的场景):9条路径
其它书里可能出现下面的图:
这样是为了计算路径的条数更加方便,防止算错
加了这样的空节点也不违反规则
红黑树的时间复杂度
假设节点个数为N
用极端的场景来算
红黑树最短路径的高度为:2^h-1 = N, h = log(N+1)
最长路径的高度为:2^2h-1 = N,h = (log(N+1))/2
其实最快可以近似为logN,最慢可以近似为2*logN,
整体上时间复杂度还是logN,只是没有AVL树那么接近logN
红黑树的结构
// 枚举红黑树的颜色
enum Colour
{
RED,
BLACK
};
// 按Key/Value的模式实现
template<class K,class V>
class RBTreeNode
{
pair<K, V> _kv;
RBTreeNode<K, V>* _left;
RBTreeNode<K, V>* _right;
RBTreeNode<K, V>* _parent;
Colour _col;
RBTreeNode(const pair<K,V>& kv)
:_kv(kv),
_left(nullptr),
_right(nullptr),
_parent(nullptr)
{}
};
template<class K,class V>
class RBTree
{
typedef RBTreeNode<K, V> Node;
public:
private:
Node* _root = nullptr;
};
插入
插入红色节点还是黑色节点呢?
- 插入红色节点可能违反规则3,红色节点的父亲可能是红色节点,父亲是黑色节点就不用管
- 插入时黑色节点必然会违反规则4,每条路径上都要有相同数量的黑色节点
- 按二叉搜索树的规则插入,不违反上面的4条规则
- 如果是空树插入,则插入黑色节点。如果是非空树插入,必然插入红色,因为黑色违反规则4
- 插入红色节点,如果父亲是黑色节点,不违反规则,插入结束
- 插入红色节点,如果父亲是红色节点,违反规则3。
插入节点c必然是红色,父亲节点p也是红色,因为之前也要遵循红黑树的规则,所以爷爷节点g也要是黑色,是红色之前就违反规则了。所以c,p,g三个节点的颜色是固定的。
先在关键看叔叔节点u了,u可以是红色,也可以是黑色,所以要分情况讨论叔叔节点的颜色。
叔叔节点情况的讨论
只变色(叔叔存在且为红)
- c为红,p为红,g为黑,u存在且为红。将p变黑,因为红红违反了规则3,p必须变红。u也变黑,g变红。
- 把g当做c继续向上更新,需要继续向上更新是因为如果g的父亲还是红色,就需要继续向上处理;如果g的父亲是黑色,就处理结束;如果g就是整棵树的根,再把g变为黑色。
抽象的情况
- 叔叔存在且为红,(a和b是抽象出来的子树)a和b要满足下面的模版,爷爷的两个孩子都是红色,才满足只变色
- 抽象的情况:
- bh(black height),bh == 0
- bh == 1
- bh == 2
变色+单旋(叔叔不存在或叔叔存在且为黑)
p,c是红,g是黑,u不存在或者u存在且为黑
- u不存在,c只能是新增节点(如果c不是新增节点的话,它只能是之前变色变过来的,那它之前就是黑色,黑色节点的数量就不对)。右旋,把父亲节点变黑,g变红
- u存在且为黑,c一定不是新增(如果c是新增,那么新增前,黑色的数量不对),c之前就是黑色的,现在变成了红色,因为进行了变色。右旋,父亲变为黑色,爷爷变为红色
- 不用继续往上更新,因为黑黑可以,红黑也可以,就不用管了。
变色+双旋(叔叔不存在或叔叔存在且为黑)
p,c是红,g是黑,u不存在或者u存在且为黑
- u不存在,c只能是新增节点(如果c不是新增节点的话,它只能是之前变色变过来的,那它之前就是黑色,黑色节点的数量就不对)。
- u存在且为黑,c一定不是新增(如果c是新增,那么新增前,黑色的数量不对),c之前就是黑色的,现在变成了红色,因为进行了变色。
- 左单旋,然后右单旋,父亲节点不变色,cur节点由红色变成黑色,grandfather节点由黑色变成红色。不用继续往上更新,因为黑黑可以,红黑也可以,就不用管了。
关键看叔叔
判断是不是红黑树
用4个规则进行判断,满足这四个规则就满足最长路径不超过最短路径的两倍。
- 规则1枚举了颜色就实现了节点不是黑色就是红色
- 规则2直接检查根的颜色是不是黑色就可以了
- 规则3不能是连续的红色节点,遇到红色节点就检查孩子不太方便,如果孩子不存在就更不方便了,并且孩子可能有两个。但是检查父亲节点的颜色就方便多了,遇到红色节点就检查父亲节点的颜色。
- 规则4是每条路径的黑色节点的数量必须相同。用前序遍历检查,用形参blacknum记录到当前节点的黑色节点的数量,遇到黑色节点就++,走到空就计算完一条路径的黑色节点的数量。用任意一条的黑色节点的数量作为参考值,依次比较。
// 判断红黑树是否平衡
bool IsBalance()
{
// 根节点是空
if (_root == nullptr)
return true;
// 根节点非空且是红色
if (_root->_col == RED)
return false;
// 算出一条路径上黑色节点的个数作为参考值
Node* cur = _root;
// 参考值
int blacknum = 0;
while (cur)
{
if (cur->_col == BLACK)
{
++blacknum;
}
// 就走最左边的一条路径
cur = cur->_left;
}
return Check(_root,0,blacknum);
}
private:
bool Check(Node* root, int blacknum, const int refnum)
{
// refnum参考值
if (root == nullptr)
{
// 当前路径走完了
if (blacknum != refnum)
{
cout << "存在黑色节点的数量不相等的路径" << endl;
return false;
}
return true;
}
// 规则3
if (root->_col == RED && root->_parent->_col == RED)
{
cout << "存在连续两个红节点" << endl;
return false;
}
if (root->_col == BLACK)
{
++blacknum;
}
return Check(root->_left, blacknum, refnum) &&
Check(root->_right, blacknum, refnum);
}
代码
#pragma once
#include<iostream>
using namespace std;
// 枚举红黑树的颜色
enum Colour
{
RED,
BLACK
};
// 按Key/Value的模式实现
template<class K,class V>
struct RBTreeNode
{
pair<K, V> _kv;
RBTreeNode<K, V>* _left;
RBTreeNode<K, V>* _right;
RBTreeNode<K, V>* _parent;
Colour _col;
RBTreeNode(const pair<K,V>& kv)
:_kv(kv),
_left(nullptr),
_right(nullptr),
_parent(nullptr)
{}
};
template<class K,class V>
class RBTree
{
typedef RBTreeNode<K, V> Node;
public:
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
_root->_col = BLACK;
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
// 不冗余,插入失败
return false;
}
}
cur = new Node(kv);
// 如果是非空树,插入红色节点
cur->_col = RED;
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else if (parent->_kv.first > kv.first)
{
parent->_left = cur;
}
// 链接父亲节点
cur->_parent = parent;
// parent是红色,出现了连续的红色节点,需要向上调整
// 调整之后cur是根,cur的parent是nullptr
while (parent&&parent->_col == RED)
{
Node* grandfather = parent->_parent;
if (grandfather->_left == parent)
{
// g
// p u
Node* uncle = grandfather->_right;
if (uncle && uncle->_col == RED)
{
// 变色是为了处理连续的红节点,保证黑节点的数量不变,
// 向上继续调整是因为grandfather的节点可能是黑节点就结束,
// 可能是红节点就继续向上处理
parent->_col = uncle->_col = BLACK;
grandfather->_col = RED;
// 继续向上处理
cur = grandfather;
parent = cur->_parent;
}
else
{
// uncle不存在或uncle存在且为黑
// g
// p u
// c
// 右单旋
if (cur == parent->_left)
{
RotateR(grandfather);
parent->_col = BLACK;
grandfather->_col = RED;
}
else
{
// 双旋
// g
// p u
// c
RotateL(parent);
RotateR(grandfather);
cur->_col = BLACK;
grandfather->_col = RED;
}
break;
}
}
else
{
// g
// u p
Node* uncle = grandfather->_left;
if (uncle && uncle->_col == RED)
{
parent->_col = uncle->_col = BLACK;
grandfather->_col = RED;
// 继续向上更新
cur = grandfather;
parent = cur->_parent;
}
else
{
// uncle不存在或者存在且是黑
// g
// u p
// c
// 左单旋
if (parent->_right == cur)
{
RotateL(grandfather);
parent->_col = BLACK;
grandfather->_col = RED;
}
else
{
// g
// u p
// c
// 双旋
RotateR(parent);
RotateL(grandfather);
cur->_col = BLACK;
grandfather->_col = RED;
}
break;
}
}
}
// 无论如何结束之后根都是黑色的
_root->_col = BLACK;
return true;
}
// 右单旋,旋转点是parent
void RotateR(Node* parent)
{
Node* subL = parent->_left;
Node* subLR = subL->_right;
parent->_left = subLR;
// b可能为空树
if (subLR != nullptr)
subLR->_parent = parent;
// 记录parent的parent
Node* pParent = parent->_parent;
subL->_right = parent;
parent->_parent = subL;
// 1. 10是这棵树的总根
if (parent == _root)
{
_root = subL;
subL->_parent = nullptr;
}
else
{
// 2. 10是这棵树的局部根
// pParent左可能是parent,右也可能是parent
if (pParent->_left == parent)
{
pParent->_left = subL;
}
else
{
pParent->_right = subL;
}
subL->_parent = pParent;
}
}
// 左单旋,旋转点是parent
void RotateL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
parent->_right = subRL;
// b不是空树
if (subRL)
subRL->_parent = parent;
// 记录父亲节点的父亲节点
Node* pParent = parent->_parent;
subR->_left = parent;
parent->_parent = subR;
// 1. 10是这棵树的总根
if (_root == parent)
{
_root = subR;
subR->_parent = nullptr;
}
else
{
// 2. 10是这棵树的局部根
if (pParent->_left == parent)
{
pParent->_left = subR;
}
else
{
pParent->_right = subR;
}
subR->_parent = pParent;
}
}
void InOrder()
{
_InOrder(_root);
cout << endl;
}
int Height()
{
return _Height(_root);
}
int Size()
{
return _Size(_root);
}
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < key)
{
cur = cur->_right;
}
else if (cur->_kv.first > key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
bool IsBalance()
{
// 根节点是空
if (_root == nullptr)
return true;
// 根节点非空且是红色
if (_root->_col == RED)
return false;
// 算出一条路径上黑色节点的个数作为参考值
Node* cur = _root;
// 参考值
int blacknum = 0;
while (cur)
{
if (cur->_col == BLACK)
{
++blacknum;
}
// 就走最左边的一条路径
cur = cur->_left;
}
return Check(_root,0,blacknum);
}
private:
bool Check(Node* root, int blacknum, const int refnum)
{
// refnum参考值
if (root == nullptr)
{
// 当前路径走完了
if (blacknum != refnum)
{
cout << "存在黑色节点的数量不相等的路径" << endl;
return false;
}
return true;
}
// 规则3
if (root->_col == RED && root->_parent->_col == RED)
{
cout << "存在连续两个红节点" << endl;
return false;
}
if (root->_col == BLACK)
{
++blacknum;
}
return Check(root->_left, blacknum, refnum) &&
Check(root->_right, blacknum, refnum);
}
void _InOrder(Node* root)
{
if (root == nullptr)
{
return;
}
_InOrder(root->_left);
cout << root->_kv.first << ":" << root->_kv.second << endl;
_InOrder(root->_right);
}
int _Height(Node* root)
{
if (root == nullptr)
return 0;
int leftHeight = _Height(root->_left);
int rightHeight = _Height(root->_right);
return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
}
int _Size(Node* root)
{
if (root == nullptr)
return 0;
return _Size(root->_left) + _Size(root->_right) + 1;
}
private:
Node* _root = nullptr;
};
#define _CRT_SECURE_NO_WARNINGS
#include"RBTree.h"
void TestRBTree1()
{
RBTree<int, int> t;
// 常规的测试用例
//int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
// 特殊的带有双旋场景的测试用例
int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16, 14 };
for (auto e : a)
{
t.Insert({ e,e });
}
t.InOrder();
cout << t.IsBalance() << endl;
}
int main()
{
TestRBTree1();
return 0;
}