关于图论建模的一份介绍
图论是离散数学的一部分,主要研究点与线所组成的形状。不过它们并非与几何中的图形类似,而是一种抽象化的产物,因此,我们可以通过这种方式来将一些生活、生产等中的问题进行建模,然后用数学规划等方式解决。所以,图论建模是数学建模中重要的一部分。而在这篇文章中,我就将介绍图论建模,具体将包含图论的一些基本概念部分以及经典的问题。
一、基本概念
1.1 图与有(无)向图
图 (Graph):由一组顶点和一组连接这些顶点的边组成。通常表示为 G = (V, E),其中 V 是顶点集合,E 是边的集合。
顶点 (Vertex):图中的基本元素,也称为节点(node)。每个顶点代表一个实体或对象。边 (Edge):连接两个顶点的线段,表示这两个顶点之间的关系。根据是否考虑方向,边可以分为有向边和无向边。
有向图 (Directed Graph):每条边都有明确的方向,即从一个顶点指向另一个顶点。有向图中的边也称为弧(arc)。
无向图 (Undirected Graph):边没有方向,只是简单地连接两个顶点。
度 (Degree):一个顶点的度是指与该顶点相连的边的数量。对于有向图,可以进一步分为:
入度 (In-degree): 指向该顶点的边的数量。
出度 (Out-degree): 从该顶点出发的边的数量。
路径 (Path):图中的一系列顶点和边,从一个顶点到另一个顶点的连续行走。路径中的顶点和边都不重复。
回路 (Cycle):一条路径,其起点和终点是同一个顶点,且路径中的其他顶点不重复。
连通图 (Connected Graph):在无向图中,如果从任何一个顶点都可以通过某些边到达另一个顶点,则称这个图为连通图。
强连通图 (Strongly Connected Graph):在有向图中,如果从任何一个顶点都可以通过某些边到达另一个顶点,则称这个图为强连通图。
完全图 (Complete Graph):如果一个图中的每对不同的顶点之间都恰好有一条边直接相连,则称此图为完全图。记为 K_n,其中 n 是顶点的数量。
子图 (Subgraph):如果一个图的所有顶点和边都是另一个图的一部分,则前者称为后者的子图。
团:团是指图中的一个子图,这个子图内部的所有顶点都是相互连接的,即子图中的每一个顶点都与其他所有的顶点直接相连。
同构 (Isomorphism):如果两个图可以通过重新标记顶点的方式变成相同的图,则这两个图是同构的。
权 (Weight):有时边会带有权重,表示某种成本、距离或强度。带权图在很多实际问题中非常有用,如最短路径问题。
邻接矩阵 (Adjacency Matrix):一个 n×n 的矩阵,用来表示一个具有 n 个顶点的图。矩阵中的元素 A[i][j] 表示顶点 i 和顶点 j 之间的边是否存在及权重。
邻接表 (Adjacency List):一种使用链表来表示图的数据结构,每个顶点对应一个链表,链表中的每个节点表示与该顶点相邻的顶点。
1.2 流网络
流网络 (Flow Network):流网络是一个有向图 G=(V,E),其中每个边 (u,v)∈E 都有一个非负容量 c(u,v)。此外,流网络中包含一个源点(source) s 和一个汇点(sink) tt。
源点 (Source):流的起点,通常记为 s。
汇点 (Sink):流的终点,通常记为 t。
流 (Flow):流是一个函数 f:V×V→R,满足以下条件:
容量限制:对于所有边 (u,v)∈E,有 0≤f(u,v)≤c(u,v)。
流量守恒:对于所有非源点和非汇点的顶点 v,流入 v 的总流量等于流出 v 的总流量,即 ∑u∈Vf(u,v)=∑w∈Vf(v,w)。
最大流 (Maximum Flow):最大流是从源点 s 到汇点 t 的最大可能流量。形式上,最大流 f 是满足上述条件的流,且 f(s,t) 的值最大。
增广路径 (Augmenting Path):增广路径是从源点 s 到汇点 t 的一条路径,路径上的每条边都可以增加一定的流量。增广路径上的最小剩余容量决定了可以增加的最大流量。其作用为:在 Ford-Fulkerson 方法中,通过不断找到并增加增广路径的流量,最终达到最大流。
残留网络 (Residual Network):残留网络 Gf=(V,Ef) 是在给定当前流 f 的情况下,表示剩余可用容量的网络。边 (u,v) 的残留容量 cf(u,v) 定义为:cf(u,v)=c(u,v)−f(u,v) (正向边)cf(v,u)=f(u,v) (反向边)
最小割 (Minimum Cut):最小割是将源点 s 和汇点 t 分开的最小容量的边集。最小割的容量等于最大流的值,这是最大流最小割定理(Max-Flow Min-Cut Theorem)的内容。作用为:最小割可以用来确定网络中的瓶颈,即哪些边的容量限制了最大流。
多商品流 (Multi-commodity Flow):多商品流问题扩展了单商品流的概念,允许多个源点和多个汇点,每个源点和汇点对之间都有一个需求量。具体应用有:多商品流问题在物流、通信网络等领域有广泛应用。
1.3 二分图
二分图(Bipartite Graph):二分图也叫二部图,一个图 G=(V,E) 是二分图,当且仅当它的顶点集 V 可以分成两个互不相交的子集 U 和 W,使得图中的每条边都连接一个 U 中的顶点和一个 W 中的顶点。换句话说,不存在两个同属于 U 或 W 的顶点之间的边。
二分性:一个图是二分图当且仅当它可以被2-着色,即可以用两种颜色对顶点进行着色,使得任意一条边的两个端点颜色不同。
奇环:一个图是二分图当且仅当它不含奇数长度的环(即长度为奇数的回路)。
匹配:在二分图中,匹配是一组边,使得这些边没有公共的顶点。即每条边的两个端点在匹配中最多出现一次。
最大匹配:在二分图中,最大匹配是指包含边数最多的匹配。
完美匹配:如果一个匹配包含了所有顶点,则称其为完美匹配。即每个顶点都恰好属于一条匹配边。
霍尔定理(Hall's Marriage Theorem):设二分图 G=(U,W,E),如果对于 U 的任意子集 S,都有 ∣S∣≤∣N(S)∣,其中 N(S) 是 S 的邻居集合,则 G 存在一个从 U 到 W 的完备匹配。
1.4 树
树:一个无向图 T=(V,E) 是树,当且仅当它满足以下条件之一:连通且无环。有 n 个顶点和 n−1 条边,且连通。任意两个顶点之间有且仅有一条路径。
连通性:树是连通的,即任意两个顶点之间都存在一条路径。
无环:树中没有环。
唯一路径:任意两个顶点之间有且仅有一条路径。
边数:一个有 n 个顶点的树有 n−1 条边。
叶子节点:度为1的顶点称为叶子节点。
深度:在树中,一个节点的深度是指从根节点到该节点的路径上的边数。根节点的深度为0。
(深度优先搜索)DFS:通过递归或栈实现,用于遍历树的所有节点,常用于求解路径、连通性等问题。
(广度优先搜索)BFS:通过队列实现,用于遍历树的所有节点,常用于求解最短路径、层次遍历等问题。
二、经典问题
2.1 戈尼斯堡七桥问题与欧拉问题
戈尼斯堡七桥问题源自18世纪的东普鲁士城市哥尼斯堡(现在的俄罗斯加里宁格勒)。这座城市的特点是普雷格尔河穿过其中,河上有两个小岛,小岛和河的两岸之间通过七座桥相连。市民们提出了一个有趣的挑战:是否有可能设计一条路径,使得从某个地点出发,每座桥恰好经过一次,最后返回出发点?
具体参考如下图片:
(图片来自网络)
对于这个问题,欧拉将问题抽象化,将城市的陆地区域(包括两个小岛和河的两岸)简化为图中的点(或称为顶点),而将桥抽象为连接这些点的线(或称为边)。这样,七桥问题就被转换为一个数学问题:在给定的图中,是否存在一条路径,能够不重复地经过所有的边,并最终回到起点?而这样的一个图就被称为欧拉图,同时,这个问题也被称呼为欧拉问题。
最后,欧拉得出结论如下:
在一个连通图中,如果存在一条路径能够不重复地遍历所有边,则这条路径被称为欧拉路径。如果这条路径还能够回到起点,则称为欧拉回路。
在一个连通的无向图中,存在欧拉路径的充要条件是图中最多有两个顶点的度数为奇数(即与该顶点相连的边数为奇数)。如果图中所有顶点的度数均为偶数,则存在欧拉回路。
然后,当我们运用刚才的结论时,会发现在戈尼斯堡七桥问题中,四个陆地区域的度数均为奇数,因此不存在符合要求的路径。
2.2 四色问题
四色问题是指否只需要四种颜色就能为任何平面地图着色,使得相邻的区域(即有共同边界线的区域,而不是仅仅接触于一点)的颜色不同。
在1879年,英国数学家阿尔弗雷德·凯莱(Alfred Kempe)发表了一篇论文,声称证明了四色定理。然而,11年后,珀西·希伍德(Percy Heawood)指出了凯莱证明中的错误,并提出了五色定理,即任何地图都可以用五种颜色着色而不会使相邻区域颜色相同。
之后直到1976年,美国数学家肯尼思·阿佩尔(Kenneth Appel)和沃尔夫冈·哈肯(Wolfgang Haken)借助计算机的帮助,首次给出了四色定理的严格证明。他们的方法涉及将所有可能的地图类型分类,并通过计算机检查每一种类型是否可以用四种颜色着色。这个证明因为使用了大量计算机计算,所以引起了广泛的讨论和争议,但它最终被认为是有效的。
2.3 顶点覆盖问题
给定一个图 G=(V(G),E(G)),顶点覆盖问题就是要寻找一个成员数量最少的子集使得图中的每条边与 S 中至少一个成员关联。
我们举个例子,有如下图:
(我们忽略其中的箭头,将之看作无向图)
我们想要在如上的一个通过抽象化后得到的一个图模型中在每个顶点上,即道路交叉口,安排警员去维持秩序,而一个警员在他所在的顶点上可以维持与之相邻的所有路上的秩序,但我们希望需要的人手越少越好,所以此时就成了一个顶点覆盖问题。
不过顶点覆盖问题是一个NP问题,我们只能找到它的近似算法,比如:
贪心算法:选择度数最大的顶点加入顶点覆盖集合,然后删除该顶点及其所有关联的边,重复此过程直到图中没有边为止。这种算法的近似比为 2,即找到的顶点覆盖的大小最多是最佳解的两倍。
线性规划松弛:将顶点覆盖问题转化为一个整数线性规划问题,然后通过线性规划的松弛来求解。通过舍入技术将线性规划解转化为整数解,可以得到较好的近似解。
比如对于上述的例子,我们可以给出 python 代码如下:
def vertex_cover_approx(graph):
# 初始化顶点覆盖集合
vertex_cover = set()
# 创建一个副本,以便在算法过程中修改图
remaining_graph = {v: set(neighbors) for v, neighbors in graph.items()}
while any(remaining_graph.values()): # 当图中还有边时继续
# 找到度数最大的顶点
max_degree = -1
max_vertex = None
for vertex, neighbors in remaining_graph.items():
degree = len(neighbors)
if degree > max_degree:
max_degree = degree
max_vertex = vertex
# 将度数最大的顶点加入顶点覆盖集合
vertex_cover.add(max_vertex)
# 删除与该顶点相关联的所有边
for neighbor in remaining_graph[max_vertex]:
remaining_graph[neighbor].discard(max_vertex)
# 删除该顶点及其边
del remaining_graph[max_vertex]
return vertex_cover
# 示例图
graph = {
'v1': ['v2', 'v4'],
'v2': ['v1', 'v3', 'v4', 'v5'],
'v3': ['v2', 'v4'],
'v4': ['v1', 'v2', 'v3', 'v5'],
'v5': ['v2', 'v4', 'v6'],
'v6': ['v5']
}
# 调用顶点覆盖近似算法
vertex_cover = vertex_cover_approx(graph)
print("顶点覆盖集合:", vertex_cover)
其输出为:
顶点覆盖集合: {'v2', 'v4', 'v5'}
2.4 最短路径问题
给定一个带权图 G=(V,E),其中 V 是顶点集,E 是边集,每条边 (u,v)∈E 有一个非负权重 w(u,v)。最短路径问题的目标是找到从源节点 s 到目标节点 t 的路径,使得路径上的总权重最小。
而对于最短路径问题,我们可以采用 Dijkstra 算法来解决。
算法基本思想:
使用优先队列(通常是最小堆)来维护一个节点集合,按照从源节点到该节点的最短距离排序。
每次从优先队列中取出距离最小的节点,更新其邻接节点的距离。
重复上述过程,直到所有节点都被处理完或找到目标节点。
算法步骤:
1.初始化:设置源节点 s 的距离为 0,其他所有节点的距离为无穷大。
2.将源节点 s 加入优先队列。
3.从优先队列中取出距离最小的节点 u。
4.对于 u 的每个邻接节点 v,如果通过 u 到达 v 的距离更短,则更新 v 的距离。
5.重复步骤 3 和 4,直到优先队列为空或找到目标节点。
那么,我们还以刚才的图为例子,并给边赋值参考代码中的邻接表,可以写出 python 代码如下:
import heapq
def dijkstra(graph, start):
# 初始化距离字典,所有节点的初始距离为无穷大
distances = {node: float('inf') for node in graph}
distances[start] = 0
# 优先队列,存储 (距离, 节点) 元组
priority_queue = [(0, start)]
while priority_queue:
# 取出距离最小的节点
current_distance, current_node = heapq.heappop(priority_queue)
# 如果当前距离大于已知的最短距离,跳过
if current_distance > distances[current_node]:
continue
# 遍历当前节点的所有邻居
for neighbor, weight in graph[current_node].items():
distance = current_distance + weight
# 如果找到更短的路径,更新距离并将其加入优先队列
if distance < distances[neighbor]:
distances[neighbor] = distance
heapq.heappush(priority_queue, (distance, neighbor))
return distances
# 示例图
graph = {
'v1': {'v2': 1, 'v4': 4},
'v2': {'v1': 1, 'v3': 2, 'v4': 3, 'v5': 2},
'v3': {'v2': 2, 'v4': 1},
'v4': {'v1': 4, 'v2': 3, 'v3': 1, 'v5': 1},
'v5': {'v2': 2, 'v4': 1, 'v6': 1},
'v6': {'v5': 1}
}
# 调用 Dijkstra 算法
start_node = 'v1'
shortest_paths = dijkstra(graph, start_node)
print(f"从 {start_node} 出发的最短路径: {shortest_paths}")
算法输出为:
从 v1 出发的最短路径: {'v1': 0, 'v2': 1, 'v3': 3, 'v4': 4, 'v5': 3, 'v6': 4}
2.5 最大流问题
最大流问题(Maximum Flow Problem)是网络流理论中的一个核心问题,主要研究在一个给定的流网络中如何从源点(source)到汇点(sink)传输尽可能多的流量。
对于这样的一个问题,我们可以通过如下的步骤来解决:
1. 寻找一条从源点到汇点的一条通路;
2. 从找出的这条通路中找出最小权值的边;
3.将整条路径中的权值都减去刚才找出的最小权值,并将这个最小的权值记录;
4. 此时,这条通路会因为刚才权值的减去而不再是通路,所以重复上述步骤;
5. 当从源点到汇点间不存在通路时,则停止,并将所有记录了的最小权值去求和,求和结果即是目标结果。
如上的步骤就是 Ford-Fulkerson 算法的步骤。那么,我们将方才给出的图像作为例子,并给图的所有边赋值,具体参考代码中的邻接表,然后可以得到python代码如下:
from collections import defaultdict
def dfs(graph, source, sink, visited, flow):
if source == sink:
return flow
visited[source] = True
for v in graph[source]:
capacity = graph[source][v]
if not visited[v] and capacity > 0:
bottleneck = dfs(graph, v, sink, visited, min(flow, capacity))
if bottleneck > 0:
graph[source][v] -= bottleneck
graph[v][source] += bottleneck
return bottleneck
return 0
def ford_fulkerson(graph, source, sink):
max_flow = 0
while True:
visited = defaultdict(bool)
flow = dfs(graph, source, sink, visited, float('inf'))
if flow == 0:
break
max_flow += flow
return max_flow
# 示例图
graph = {
's': {'v1': 16, 'v2': 13},
'v1': {'v2': 10, 'v3': 12},
'v2': {'v1': 4, 'v4': 14},
'v3': {'v2': 9, 't': 20},
'v4': {'v3': 7, 't': 4},
't': {}
}
# 调用 Ford-Fulkerson 算法
source = 's'
sink = 't'
max_flow = ford_fulkerson(graph, source, sink)
print(f"最大流: {max_flow}")
2.6 二部图匹配问题
二部图匹配问题是指在一个二部图中找到一组边,使得每条边连接的两个顶点都不在其他边中出现。二部图是一个特殊的图,其中顶点可以分成两个不相交的集合 U 和 V,并且每条边都连接一个 U 中的顶点和一个 V 中的顶点。
对于这个问题,我们同样可以使用在最大流中的算法去解决,在此不多赘述了。
2.7 旅行推销员问题
给定一个城市集合 V 和每对城市之间的距离 d(i,j),其中 d(i,j) 表示城市 i 和城市 j 之间的距离。TSP 的目标是找到一个遍历所有城市的路径,使得路径的总距离最小,并且路径的起点和终点相同。
这个问题同四色问题与顶点覆盖问题一样,都是NP问题,并且还是一个NP完全问题。所以我们可以有一些近似算法去解决,比如分支限界法和动态规划算法。
这两个算法在我之前的文章中都有所介绍,所以在此不多言了。
此上