当前位置: 首页 > article >正文

【狂热算法篇】并查集:探秘图论中的 “连通神器”,解锁动态连通性的神秘力量(通俗易懂版)

嘿,朋友们!喜欢这个并查集的讲解吗 记得点个关注哦,让我们一起探索算法的奥秘,别忘了一键三连,你的支持是我最大的动力!  

 欢迎拜访:羑悻的小杀马特.-CSDN博客

本篇主题:深度剖析并查集算法及一系列优化

制作日期:2025.01.13

隶属专栏:美妙的算法世界

下面我们就介绍一下并查集是啥吧:

目录

 一·概念:

二·数据结构表示:

 三·基本操作及实现:

3.1初始化:

3.2查找操作(root):

3.3 合并操作(merge):

朴素版:

 四.优化策略:

4.1路径压缩:

4.2按秩合并:

4.3按大小合并(启发合并):

五·优化前后对比:

5.1 优化前:

5.2优化后: 

 六·例题测试:

七.应用场景:

 7.1网络连通性问题:

7.2社交网络中的朋友圈问题:

7.3:图论中的最小生成树算法(如 Kruskal 算法):

八·个人小结:


 一·概念:

并查集是一种树型的数据结构,用于处理不相交集合的合并及查询问题。它主要支持两种操作:“并”(Union)操作,即将两个不相交的集合合并为一个集合;“查”(Find)操作,即查找元素所在的集合(大概它的外形也可以理解为多插树的形式)。

并查集在解决元素分组和动态连通性问题上展现出强大的能力,能够高效地处理元素之间的关系,判断元素是否属于同一集合,以及将不同集合进行合并操作。

这里我们就记住:同根就连通,合并总发生在根上。 

二·数据结构表示:

 数组存储:

最常见的实现方式是使用一个数组 pre[] 来存储每个元素的父节点信息。初始时,每个元素自成一个集合,所以 pre[i] = i,表示元素 i 是它自己集合的代表元素即根节点.

当然了,还会有其他表示方法:

也可以使用链表、树等数据结构表示并查集,但数组是最常用的,因为其实现简单,操作相对便捷,并且在经过优化后可以达到理想的性能。

 三·基本操作及实现:

3.1初始化:

void init() {
    for (int i = 1; i <= n; i++) {
        pre[i] = i;//无连接把自身初始化成前驱节点
    }
    return;
}

这里就不用多解释了把,一开始还没给关系,它们每个节点自己就是一个集合,自己是自己的根节点。 

3.2查找操作(root):

功能:查找元素所在集合的代表元素(根节点)。

通过不断查找元素的父节点,直到找到父节点为自身的元素,该元素即为集合的代表元素。

这里我们可以用循环来实现也可以用递归;但是如果它深度太高还是循环比较友好,但是一般数据又不会太大。

比如我们举个例子:

例如,对于集合 {0, 1, 2},其中 pre[0] = 0pre[1] = 0pre[2] = 1,查找元素 2 的根节点时,先找到 pre[2] = 1,继续查找 pre[1] = 0,最终找到根节点为 0。

下面就用普通的递归实现我们的查找操作:

int root(int x) {
     return pre[x]==x?x:root(pre[x]);//递归找到根节点
}

3.3 合并操作(merge)

功能:将两个元素所在的集合合并为一个集合。

首先找到两个元素的根节点,如果根节点不同,则将其中一个根节点作为另一个根节点的子节点,完成集合的合并。

注意:合并操作不是就是找根节点嘛,这里我们可以规定方向但是也可以不规定:前提是,我们保证所合并的集合的每个节点的通过父亲节点找到的根节点一定是同一个即可。(但是对于朴素法,也就是我们上面所写的,还没有做优化,可以认为后者的根节点点是前者的根节点的根节点)

下面就是简单版本的合并:

void merge(int i, int j) {
    int x = root(i), y = root(j);
    pre[x]=y;
    return;
}
 

这样就是实现好了。其实上面实现的就是我们的朴素版本。

朴素版:

const int N = 5005;

/// <summary>
/// 多插树
/// </summary>
int pre[N];//类似前驱节点,pre[i]是i指向的前一个节点j:i->j
int rk[N];//每个节点的秩:高度
int sz[N];//以i号节点作为根节点的集合的节点个数
int n, m, p;

void init() {
    for (int i = 1; i <= n; i++) {
        pre[i] = i;//无连接把自身初始化成前驱节点
    }
    return;
}
//找根节点:
int root(int x) {
     return pre[x]==x?x:root(pre[x]);//递归找到根节点
}
//合并总发生在根节点:
void merge(int i, int j) {
    int x = root(i), y = root(j);
    pre[x]=y;
    return;
}

但是这样肯定是时间复杂度肯定比较高的,可以认为为O(N);那么下面我们来介绍一下它的优化策略。

 四.优化策略:

下面我们分三种情况来把朴素版给优化一下:

4.1路径压缩:

介绍:在查找操作时,将查找路径上的元素的父节点都直接指向根节点,以减少后续查找的时间复杂度。 

那么我们只需要,在查找元素的根节点时,将路径上的元素的父节点直接更新为根节点。

也就是我们最后的目的就是让每个点的父亲节点都是他们的根节点即可。 

 当然了它的实现可以是循环解决也可以是递归,但是对于数据不是特别大,我们就选递归,因为它比较好写:

4.1.1递归版本:

//找根节点:
int root(int x) {
   return pre[x]=pre[x] == x ? x : root(pre[x]);//递归找到根节点,归的时候完成对当前节点的最终指向(根节点)
   
}

4.1.2迭代版本: 

int root(int x){
 	int r=x;
 	while(pre[r]>=0){
 		 r=pre[r];
	 }
	 //拿到根:
	 while(pre[r]>=0){
	 	int res=pre[x];
	 	  pre[x]=r;
	 	  x=res;
	 	  
	 } 
	 return r;
 }

这个优化只需要我们更改找根操作即可,其他和朴素法一样。 

 但是这样就一定好嘛,我们之前说的是它是一个多插树,这样就破坏了,树的结构,当然也是可以用的(只限于单个数据结构,也就是只有它自己);但是如果还要和其他数据结构的功能配合使用,那么就麻烦了;因此我们就要建议使用后面的优化方法了。

时间复杂度就降到O(1)了。

总代码:

const int N = 5005;

/// <summary>
/// 多插树
/// </summary>
int pre[N];//类似前驱节点,pre[i]是i指向的前一个节点j:i->j
int rk[N];//每个节点的秩:高度
int sz[N];//以i号节点作为根节点的集合的节点个数
int n, m, p;

路径压缩:破坏树结构

void init() {
    for (int i = 1; i <= n; i++) {
        pre[i] = i;//无连接把自身初始化成前驱节点
    }
    return;
}
//找根节点:
int root(int x) {
   return pre[x]=pre[x] == x ? x : root(pre[x]);//递归找到根节点,归的时候完成对当前节点的最终指向(根节点)
   
}
//合并总发生在根节点:
void merge(int i, int j) {
    int x = root(i), y = root(j);
    pre[x] = y;
    return;
}

4.2按秩合并:

目的:避免合并操作使树变得过于不平衡,影响查找性能。

为每个节点维护一个秩(rank),可以是树的高度或集合的大小,即叶子节点秩为0,合并时将秩小的集合合并到秩大的集合,秩相等时任意合并并更新秩。

说白了也就是让我们的这颗树变的矮一点,胖一点而不是高高瘦瘦的;那这样为什么能起到优化作用呢?

我们的秩就是树高,如果我们让秩小的和并时候指向高的,也就是让高树的根节点成为矮树根节点的父亲节点;这样我们在查询高树的N多个底层节点的时候就可以少走一次了 ;矮树多走一步,但是它相对走的少啊。

那么这就得出结论了:

让秩小的根节点指向秩大的根节点;如果相同呢?那么随便指向,但是此时我们就要更新最终根节点的秩,也就是加一了(这里其实就不完全考虑我们上面朴素法定义的关系指向了,只需要保证同集合共根即可)。

时间复杂度就近似O(logN)了。 

定义rk数组存放每个节点的秩: 

void merge(int i, int j) {
    int x = root(i), y = root(j);
       if (rk[x] < rk[y]) swap(x, y);
       //保证x的秩大。秩大的指向秩小的:(根节点)
       pre[y] = x;
       if (rk[x] == rk[y])rk[x]++;//如果相等则根节点可以互相指向,但是被指向的节点秩要更新
    return;
}

然而这里我们只需要更改合并操作;对于查找的操作(我们也可以修改成循环形式):

总代码:

const int N = 5005;

/// <summary>
/// 多插树
/// </summary>
int pre[N];//类似前驱节点,pre[i]是i指向的前一个节点j:i->j
int rk[N];//每个节点的秩:高度
int sz[N];//以i号节点作为根节点的集合的节点个数
int n, m, p;

/// /按秩合并:根据高度关系让root函数查找的时候找的更快(每个节点都少走一个,提高效率)
void init() {
for (int i = 1; i <= n; i++) {
    pre[i] = i;//无连接把自身初始化成前驱节点
}
return;
}
//找根节点:
int root(int x) {
    //return pre[x] == x ? x : root(pre[x]);//递归找到根节点
    while (pre[x] != x) x = pre[x];
    return x;
}
//合并总发生在根节点:
void merge(int i, int j) {
    int x = root(i), y = root(j);
       if (rk[x] < rk[y]) swap(x, y);
       //保证x的秩大。秩大的指向秩小的:(根节点)
       pre[y] = x;
       if (rk[x] == rk[y])rk[x]++;//如果相等则根节点可以互相指向,但是被指向的节点秩要更新
    return;
}

4.3按大小合并(启发合并):

这里其实和按秩排序优化效果上一样;只不过不是根据秩划分;而是根据集合的大小来划分罢了。

就是我们合并的时候,肯定会有多个集合;那么我们要想集合里的元素越多,那么它向上找根次数肯定越多,那么如果一个大集合和一个小集合合并是不是让大集合的根指向小集合的根就可以少走很多次了(类似按秩合并思想,只是写法不同罢了)

时间复杂度就近似O(logN)了。

因此得到总结: 

小集合根节点指向大集合根节点;如果相同,两个根节点可以随机指向;其次注意合并后要更新集合大小。

因此我们搞一个数组为sz[]记录每个集合大小:

也就是:int sz[N];以i号节点作为根节点的集合的节点个数 。

但是这里还有个细节(很容易忽略):我们这个操作不仅要改变指向,集合大小,还要注意初始化,每个节点一开始的集合大小就是1;不像按秩合并一样(因为叶子节点本身秩就是0):
 

void init() {
    for (int i = 1; i <= n; i++) {
        pre[i] = i;//无连接把自身初始化成前驱节点
        sz[i] = 1;//注意数组含义(集合节点数)/细节/
    }
    return;
}

合并:

void merge(int i, int j) {
    int x = root(i), y = root(j);
    if (sz[x] < sz[y]) swap(x, y);
    //保证x是大集合:
    pre[y] = x;
    sz[x] += sz[y];//有y集合的纳入,x变大,的sz也增大
    return;
}

总代码:

const int N = 5005;

/// <summary>
/// 多插树
/// </summary>
int pre[N];//类似前驱节点,pre[i]是i指向的前一个节点j:i->j
int rk[N];//每个节点的秩:高度
int sz[N];//以i号节点作为根节点的集合的节点个数
int n, m, p;

/// /按大小合并(启发合并):
void init() {
    for (int i = 1; i <= n; i++) {
        pre[i] = i;//无连接把自身初始化成前驱节点
        sz[i] = 1;//注意数组含义(集合节点数)/细节/
    }
    return;
}
//找根节点:
int root(int x) {
   // return pre[x] == x ? x : root(pre[x]);//递归找到根节点
    while (pre[x] != x) x = pre[x];
    return x;
}
//合并总发生在根节点:
void merge(int i, int j) {
    int x = root(i), y = root(j);
    if (sz[x] < sz[y]) swap(x, y);
    //保证x是大集合:
    pre[y] = x;
    sz[x] += sz[y];//有y集合的纳入,x变大,的sz也增大
    return;
}

五·优化前后对比:

5.1 优化前:

单次查找或合并操作的最坏情况时间复杂度为 o(N),因为树可能退化成链,查找元素时可能需要遍历整个链。

5.2优化后: 

经过路径压缩和按秩合并优化,单次查找或合并操作的平均时间复杂度接近o(\alpha(N)) ,其中 \alpha(N) 是阿克曼函数的反函数,其增长速度非常慢,在实际应用中可近似认为是常数时间复杂度,因此优化后的并查集在效率上有显著提升。

 六·例题测试:

下面我们就以一道洛谷的并查集模版题测试一下吧:

输入:

6 5 3
1 2
1 5
3 4
5 2
1 3
1 4
2 3
5 6

输出: 

Yes
Yes
No

数据范围(还是比较小的):
 

链接: 亲戚 - 洛谷

首先我们每个写法无论优化还是不优化都是可以通过的:

这里数据范围比较小,所以优化肯定是成立的但是我们一般看不太出来: 

这里按大小合并确实有点离谱了,但是数据还是比较少的;因此理论应该是和按秩合并一样的。 

main函数实现: 

int main() {
    ios::sync_with_stdio(0), cin.tie(0), cout.tie(0);//取消同步
    cin >> n >> m >> p;
    init();//初始化,自己指向自己
    while (m--) {
        int i, j;
        cin >> i >> j;
        merge(i, j);//合并:完成节点的指向i->j。
    }
    while (p--) {
        int a, b;
        cin >> a >> b;
        if (root(a) == root(b)) cout << "Yes" << endl;//根节点相同属于同一个节点
        else cout << "No" << endl;
    }

}

七.应用场景:

 7.1网络连通性问题

在计算机网络中,判断两台计算机是否处于同一子网,将计算机视为元素,当新的连接建立时,可以使用并查集合并集合。

例如,在网络拓扑中,每台计算机开始是独立的集合,当连接两台计算机时,通过并查集的合并操作将它们所在集合合并,表示它们处于同一连通区域。

7.2社交网络中的朋友圈问题:

判断两个人是否属于同一朋友圈,添加好友时可以合并两个朋友圈集合。

比如在社交软件中,每个人开始是一个独立的朋友圈,当添加好友时,使用并查集将两人所在的朋友圈集合合并。

7.3:图论中的最小生成树算法(如 Kruskal 算法):

用于判断边的两个端点是否在同一连通分量,若不在,则合并它们所在的连通分量。

在 Kruskal 算法中,对边进行排序,依次取出边,若边的两端不在同一集合,使用并查集的合并操作,最终形成最小生成树。

 因此:

并查集作为一种高效的数据结构,通过简单的数组存储和优化的查找、合并操作,在元素分组、动态连通性判断等方面具有广泛的应用。它在解决网络、社交和图算法等领域的问题时,能够提供简洁有效的解决方案,优化后的并查集在性能上表现出色,是处理集合操作和图论问题的重要工具之一。

八·个人小结:

 个人认为,我们在进行实现时候,要注意两点:同根即连通,合并总发生在根上(指向无所谓,只要保证同一个集合元素一定都同根即可);其次就是使用:判断是否有关系,组别划分等;根据题目分析即可。


http://www.kler.cn/a/544037.html

相关文章:

  • RK3588视觉控制器与AI 算法:开启工业视觉检测新境界
  • Spring AI 介绍
  • 100.15 AI量化面试题:PPO与GPPO策略优化算法的异同点
  • deepseek大模型集成到idea
  • html为<td>添加标注文本
  • “可通过HTTP获取远端WWW服务信息”漏洞修复
  • esxi添加内存条因为资源不足虚拟机无法开机——避坑
  • 尚硅谷爬虫note002
  • Android Studio 打包App问题
  • 深入理解 Scoped CSS 的限制及其穿透方法
  • Synchronized使用
  • IJCAI2022 | RPA | 利用随机补丁增强对抗样本的可转移性
  • 浅谈Java Spring Boot 框架分析和理解
  • LeetCode--二叉树前中后遍历(迭代遍历)
  • 实操部署DeepSeek,添加私有知识库
  • 【Unity3D】Unable to detect SDK in the selected directory
  • 基于单片机的电子式单项智能电表设计(论文+源码)
  • AF3 superimpose函数解读
  • 持久性HTTPVS.非持久性HTTP
  • ASP.NET Core用MediatR实现领域事件
  • 2025年02月11日Github流行趋势
  • MySQL的字符集(Character Set)和排序规则(Collation)
  • JavaScript中Map和Set数据结构详解
  • Gitlib 企业本地部署
  • docker compose部署flink集群
  • 盛铂科技SWFA100捷变频频率综合器:高性能国产射频系统的关键选择