高阶数据结构——图
文章目录
目录
文章目录
前言
一、并查集
1、并查集概念
2、并查集的实现
二、图的概念
三、邻接矩阵、邻接表的存储
1、邻接矩阵
写过注释了,就不展开解释了。
2、邻接表
四、图的遍历
1、广度优先遍历
2、深度优先遍历
编辑
前言
一、并查集
1、并查集概念
在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个 单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一 个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-find set)。
如果说有一个森林,我们想要将它在数组中找到对应的关系因该怎么做呢?
从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。
从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。
仔细观察数组中内融化,可以得出以下结论:
1. 数组的下标对应集合中元素的编号
2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数
3. 数组中如果为非负数,代表该元素双亲在数组中的下标
现在0集合有7个人,2集合有3个人,总共两个朋友圈。
通过以上例子可知,并查集一般可以解决一下问题:
1. 查找元素属于哪个集合
沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
2. 查看两个元素是否属于同一个集合
沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在3. 将两个集合归并成一个集合
两个集合中的元素合并
将一个集合名称改成另一个集合的名称
4. 集合的个数
遍历数组,数组中元素为负数的个数即为集合的个数
2、并查集的实现
原理:下标对应的数是负数就为父亲节点;然后让孩子的值加到父亲上去,孩子节点记录父亲节点的下标;
代码实现:
#pragma once
#include<vector>
#include<cstdlib>
#include<map>
#include<iostream>
using namespace std;
class UnionFindSet
{
public:
UnionFindSet(size_t n)
:_Set(n,-1)
{}
//映射关系
//下标等价于名字,下标存储的值为根
size_t FindRoot(int x)
{
int root = x;
while (_Set[root]>0)
{
root = _Set[root];
}
return root;
}
//合并两棵树
void Union(int x1, int x2)
{
//合并两个数,将它们的根节点合并在一起;将节点少的的合并到节点多的里面、
size_t root1 = FindRoot(x1);
size_t root2 = FindRoot(x2);
//找到了两数的根,将两个数的根合并
//找对比节点个数,root对应的下标的绝对值为节点个数
if (abs(_Set[root1]) < abs(_Set[root2]))
{
swap(root1, root2);
}
//root1大于root2
//将root2加到root1
//root2的指向root1
_Set[root1] += _Set[root2];
_Set[root2] = root1;
}
//统计根的个数
size_t SetCount()
{
int count = 0;
for (int i = 0; i < _Set.size(); i++)
{
if (_Set[i] < 0) count++;
}
return count;
}
private:
vector<int> _Set;//定于一个数组
};
void TestUFS()
{
UnionFindSet u(10);
u.Union(0, 6);
u.Union(7, 6);
u.Union(7, 8);
u.Union(1, 4);
u.Union(4, 9);
u.Union(2, 3);
u.Union(2, 5);
cout << u.SetCount() << endl;
}
代码都有注释,就不再多数了。
相关力扣题目
省份数量
二、图的概念
图是由顶点集合及顶点间的关系组成的一种数据结构:G = (V, E),其中:
顶点集合V = {x|x属于某个数据对象集}是有穷非空集合;
E = {(x,y)|x,y属于V}或者E = {|x,y属于V && Path(x, y)}是顶点间关系的有穷集合,也叫 做边的集合。
(x, y)表示x到y的一条双向通路,即(x, y)是无方向的;Path(x, y)表示从x到y的一条单向通路,即 Path(x, y)是有方向的。
顶点和边:图中结点称为顶点,第i个顶点记作vi。两个顶点vi和vj相关联称作顶点vi和顶点vj之间 有一条边,图中的第k条边记作ek,ek = (vi,vj)或。
有向图和无向图:在有向图中,顶点对是有序的,顶点对称为顶点x到顶点y的一条 边(弧),和是两条不同的边,比如下图G3和G4为有向图。
在无向图中,顶点对(x, y) 是无序的,顶点对(x,y)称为顶点x和顶点y相关联的一条边,这条边没有特定方向,(x, y)和(y,x) 是同一条边,比如下图G1和G2为无向图。注意:无向边(x, y)等于有向边和。
完全图:在有n个顶点的无向图中,若有n * (n-1)/2条边,即任意两个顶点之间有且仅有一条边, 则称此图为无向完全图,比如上图G1;在n个顶点的有向图中,若有n * (n-1)条边,即任意两个 顶点之间有且仅有方向相反的边,则称此图为有向完全图,比如上图G4。
邻接顶点:在无向图中G中,若(u, v)是E(G)中的一条边,则称u和v互为邻接顶点,并称边(u,v)依 附于顶点u和v;在有向图G中,若是E(G)中的一条边,则称顶点u邻接到v,顶点v邻接自顶 点u,并称边与顶点u和顶点v相关联。
顶点的度:顶点v的度是指与它相关联的边的条数,记作deg(v)。在有向图中,顶点的度等于该顶 点的入度与出度之和,其中顶点v的入度是以v为终点的有向边的条数,记作indev(v);顶点v的出度 是以v为起始点的有向边的条数,记作outdev(v)。因此:dev(v) = indev(v) + outdev(v)。
注 意:对于无向图,顶点的度等于该顶点的入度和出度,即dev(v) = indev(v) = outdev(v)。
路径:在图G = (V, E)中,若从顶点vi出发有一组边使其可到达顶点vj,则称顶点vi到顶点vj的顶 点序列为从顶点vi到顶点vj的路径。
路径长度:对于不带权的图,一条路径的路径长度是指该路径上的边的条数;对于带权的图,一 条路 径的路径长度是指该路径上各个边权值的总和。
简单路径与回路:若路径上各顶点v1,v2,v3,…,vm均不重复,则称这样的路径为简单路 径。若路 径上第一个顶点v1和最后一个顶点vm重合,则称这样的路径为回路或环。
子图:设图G = {V, E}和图G1 = {V1,E1},若V1属于V且E1属于E,则称G1是G的子图
连通图:在无向图中,若从顶点v1到顶点v2有路径,则称顶点v1与顶点v2是连通的。如果图中任 意一 对顶点都是连通的,则称此图为连通图。
强连通图:在有向图中,若在每一对顶点vi和vj之间都存在一条从vi到vj的路径,也存在一条从vj 到 vi的路径,则称此图是强连通图。
生成树:一个连通图的最小连通子图称作该图的生成树。有n个顶点的连通图的生成树有n个顶点 和n-1条边。
三、邻接矩阵、邻接表的存储
因为图中既有节点,又有边(节点与节点之间的关系),因此,在图的存储中,只需要保存:节点和 边关系即可。节点保存比较简单,只需要一段连续空间即可,那边关系该怎么保存呢?
1、邻接矩阵
因为节点与节点之间的关系就是连通与否,即为0或者1,因此邻接矩阵(二维数组)即是:先用一 个数组将定点保存,然后采用矩阵来表示节点与节点之间的关系。
注意: 1. 无向图的邻接矩阵是对称的,第i行(列)元素之和,就是顶点i的度。有向图的邻接矩阵则不一 定是对称的,第i行(列)元素之后就是顶点i 的出(入)度。
2. 如果边带有权值,并且两个节点之间是连通的,上图中的边的关系就用权值代替,如果两个 顶点不通,则使用无穷大代替
3. 用邻接矩阵存储图的有点是能够快速知道两个顶点是否连通,缺陷是如果顶点比较多,边比 较少时,矩阵中存储了大量的0成为系数矩阵,比较浪费空间,并且要求两个节点之间的路 径不是很好求。
//邻接矩阵
namespace Matrix
{
template<class V,class W ,W MAX_W = INT_MAX, bool Direction = false >
class Graph
{
public:
typedef Graph<V, W, MAX_W, Direction> Self;
Graph() = default;
Graph(const V* vertexs, size_t n)
{
for (int i = 0; i < n; i++)
{
_vertexs.push_back(vectexs[i]);//将名字存进来
_vIndexMap[vertexs[i]] = i;//将名字的下标映射出来
}
_matrix.resize(n);//开辟n*n矩阵
for (auto e : _matrix)
{
e.resize(n, MAX_W);//初始化为最大值,也就是无边
}
}
size_t GetVertexIndex(const V& v)
{
auto ret = _matrix.find(v);//在map里面找v的映射的下标
if (ret != _matrix.end())
{
return ret->secont;
}
else
{
throw invalid_argument("不存在顶点");
return -1;
}
}
void _AddEdge(size_t srci, size_t dsti, const W& w)
{
_matrix[srci][dsti] = w;
if (Direction == false)//说明无向边
{
_matrix[dsti][srci] = w;
}
}
void AddEdge(const V& src, const V& dst, const W& w)
{
//连接两个节点
//向知道他们的下标
size_t srci = GetVertexIndex(src);
size_t dsti = GetVertexIndex(dat);
//然后存储到矩阵中
_AddEdge(srci, dsti, w);
}
void BFS(const V& src)
{
}
void _DFS(size_t srcIndex, vector<bool>& visited)
{}
void DFS(const V& src)
{}
void Print()
{}
private:
//需要一个矩阵存储元素之间的关系
vector<vector<W>> _matrix;
//存储需要存储的数据名,因为矩阵的下标都是数字
vector<V> _vertexs;
//映射下标,用来通过名字找下标的
map<V, int> _vIndexMap;
};
}
写过注释了,就不展开解释了。
2、邻接表
邻接表:使用数组表示顶点的集合,使用链表表示边的关系。
1. 无向图邻接表存储
注意:无向图中同一条边在邻接表中出现了两次。如果想知道顶点vi的度,只需要知道顶点 vi边链表集合中结点的数目即可。
2. 有向图邻接表存储
注意:有向图中每条边在邻接表中只出现一次,与顶点vi对应的邻接表所含结点的个数,就 是该顶点的出度,也称出度表,要得到vi顶点的入度,必须检测其他所有顶点对应的边链 表,看有多少边顶点的dst取值是i。
// 临接表
namespace LinkTable
{
//邻接表的结构和哈希桶相似
template<class W>
struct LinkEdge
{
int _srcIndex;
int _dstIndex;
W _w;
LinkEdge<W>* _next;
LinkEdge(const W& w)
: _srcIndex(-1)
, _dstIndex(-1)
, _w(w)
, _next(nullptr)
{}
};
template<class V, class W, bool Direction = false>
class Graph
{
public:
Graph(const V* vertexs, size_t n)//和邻接矩阵初始化一样
{
_vertexs.reserve(n);
for (size_t i = 0; i < n; ++i)
{
_vertexs.push_back(vertexs[i]);
_vIndexMap[vertexs[i]] = i;
}
_linkTable.resize(n, nullptr);
}
size_t GetVertexIndex(const V& v)//找名字的下标
{
auto ret = _vIndexMap.find(v);
if (ret != _vIndexMap.end())
{
return ret->second;
}
else
{
throw invalid_argument("不存在的顶点");
return -1;
}
}
void AddEdge(const V& src, const V& dst, const W& w)
{
//找到两个名字映射的下标
size_t srcindex = GetVertexIndex(src);
size_t dstindex = GetVertexIndex(dst);
//有向边
// 0 1
Edge* sd_edge = new Edge(w);//实例化节点
sd_edge->_srcIndex = srcindex;
sd_edge->_dstIndex = dstindex;
sd_edge->_next = _linkTable[srcindex];
_linkTable[srcindex] = sd_edge;
// 1 0
// 无向图
if (Direction == false)
{
Edge* ds_edge = new Edge(w);
ds_edge->_srcIndex = dstindex;
ds_edge->_dstIndex = srcindex;
ds_edge->_next = _linkTable[dstindex];
_linkTable[dstindex] = ds_edge;
}
}
private:
map<string, int> _vIndexMap; //通过字符串找下标
vector<V> _vertexs; // 顶点集合
vector<Edge*> _linkTable; // 边的集合的临接表
};
void TestGraph()
{
string a[] = { "张三", "李四", "王五", "赵六" };
Graph<string, int> g1(a, 4);
g1.AddEdge("张三", "李四", 100);
g1.AddEdge("张三", "王五", 200);
g1.AddEdge("王五", "赵六", 30);
}
}
原理和哈希桶一样
哈希桶
四、图的遍历
给定一个图G和其中任意一个顶点v0,从v0出发,沿着图中各边访问图中的所有顶点,且每个顶 点仅被遍历一次。"遍历"即对结点进行某种操作的意思。
请思考树以前是怎么遍历的,此处可以直接用来遍历图吗?为什么?
1、广度优先遍历
大家看这两张图片还有遍历这个概念有没有想到树的遍历,我们树分为前、中、后序遍历,还有层序遍历,而这个广度优先遍历就有层序遍历的感觉。
其实二叉树就是特殊的图,而不能说图就是树。
回忆树的层序遍历,思考:如何防止节点被重复遍历
力扣的二叉树的层序遍历:
102. 二叉树的层序遍历
代码:
class Solution {
public:
vector<vector<int>> levelOrder(TreeNode* root) {
int sizen=0;
queue<TreeNode*> q;
if(root)
{
q.push(root);
sizen++;
}
vector<vector<int>> vv;
int leve=0;
while(!q.empty())
{
vector<int> v;
while(sizen--)
{
TreeNode* front=q.front();
q.pop();
v.push_back(front->val);
if(front->left)
{
q.push(front->left);
}
if(front->right)
{
q.push(front->right);
}
}
vv.push_back(v);
sizen=q.size();
}
return vv;
}
};
原理我们运用了队列,出栈时,将自己的孩子节点带进队列;
好了回归广度优先遍历
void BFS(const V& src)
{
size_t srcindex = GetVertexIndex(src);
vector<bool> visited;//创建一个数组用来记录哪些数据是被访问过的,避免了重复访问
visited.resize(_vertexs.size(), false);
queue<int> q;//创建队列
q.push(srcindex);//想让根节点出队列
visited[srcindex] = true;//根被访问过了标记一下
size_t d = 1;
size_t dSize = 1;
//核心算法
while (!queue.empty())
{
printf("%s的%d度好友:", src.c_str(), d);
while (dSize--)
{
size_t front = q.front();//记录队头下表,也就是出队元素下标
q.pop();
for (size_t i = 0; i < _vertexs.size(); ++i)
{
if (visited[i] == false && _matrix[front][i] != MAX_W)//如果没有被访问,并且是连接节点就入队列
{
printf("[%d:%s] ", i, _vertexs[i].c_str());
visited[i] = true;//访问过了标记
q.push(i);//
}
}
}
}
cout << endl;
dSize = q.size();
++d;
cout << endl;
}
2、深度优先遍历
这就是树的递归遍历的思想
void _DFS(size_t srci, vector<bool>& visited)
{
cout << srci << ":" << _vertexs[srci] << endl;//打印节点信息
visited[srci] = true;//访问记录
// 找一个srci相邻的没有访问过的点,去往深度遍历
for (size_t i = 0; i < _vertexs.size(); ++i)
{
if (_matrix[srci][i] != MAX_W && visited[i] == false)//遍历数组所对应的行,也就有边的节点,看那么没有访问
{
_DFS(i, visited);
}
}
}
void DFS(const V& src)
{
size_t srci = GetVertexIndex(src);//找下标
vector<bool> visited(_vertexs.size(), false);//建立标识表,用于记录访问过的节点
_DFS(srci, visited);
}