依赖网络系统混合级联故障下系统可靠性提高与弹性的组合优化
题目:Combined optimization of system reliability improvement and resilience with mixed cascading failures in dependent network systems
作者:Jian Zhou
关键词: 级联故障 网络依赖 硬化与修复的联合优化弹性增强
摘要
现代社会的有效运行在很大程度上依赖于具有网络化结构的关键基础设施的可靠运行。这些网络系统的弹性成为一个非常值得关注的问题,因为日益复杂的网络依赖性导致了现实世界网络系统中破坏性的级联故障,尽管这种情况并不常见。传统上,系统加固和恢复是依次使用的,以减少系统故障的影响,而它可能不能有效地减轻依赖网络系统中的级联故障。建立了一种新的级联故障模型,该模型考虑了与网络依赖性相关的局部和全局网络负载重分配导致的多重故障的混合。提出了一个联合优化网络系统加固和恢复的框架,以提高对混合级联故障的恢复能力。该框架旨在最小化总成本,包括系统加固成本、恢复成本和级联故障造成的经济损失。在案例研究中,从电网综合恢复能力的角度探讨了发输电系统级联故障对配电系统的影响。为了解决这一随机问题,提出了混合整数遗传算法。结果表明,这项研究可以为如何从未来不可预见的级联故障中经济有效地减轻和恢复现实生活中的依赖网络系统提供见解。
1引言
本文建立了一个新的模型来描述由局部和全局网络负荷重分配和网络依赖性引发的多重故障的级联。提出了一个同时优化网络加固和恢复的框架,以最小的成本提高弹性。分析了混合级联故障时电网的整体恢复能力。除了弹性损失度量外,还应用机会约束概率(CCP)和网络连通性来评估案例研究中提出的框架。本文还研究了网络依赖性对系统加固和恢复有效性的影响。
本文的要点如下:第2节介绍了依赖网络的混合级联故障模型。在第3节中,提出了一个新的框架,用于联合优化网络硬化和恢复以提高弹性。第4节给出了验证所提出的级联失效模型和优化框架的案例研究。第5节最后讨论了主要研究成果和未来的工作。
2. 混合级联失效模型
已经提出了局部和全局负载再分配模型来描述系统负载动态如何影响级联故障。局部负载重分配意味着故障的系统节点主要影响其功能的相邻节点。它假设故障节点上的负载是局部重新分配的,因此只有邻居中的功能节点受到影响,并且可能过载。全局负载重分配模型假设系统组件故障可能会对不受局部约束的功能组件造成负载干扰,即组件故障会在全局范围内启动网络负载重分配。这两种负载重分配行为在一些现实世界的系统中同时存在,而当前的级联故障模型很少考虑或没有适当地描述这一现象。在本节中,提出了一种混合级联失效模型,该模型考虑了与系统依赖性相关的局部和全局负载再分配的影响。
2.1. 初步描述
对于节点故障后的全局负载重新分配,当依赖集群中出现新的节点故障时,故障节点上的部分负载被转移到同一依赖集群中的功能节点上,这些节点可能不在故障节点的邻域内。因此,全局负载重分配的影响主要来自于系统依赖性。每个节点都有一定的节点容量,这是它在不发生拥塞的情况下所能处理的最大负载。每当节点负载超过节点容量时,节点就会以过载状态发生故障。此外,当节点与网络中连接最大的组件断开连接时,节点将无法正常工作它是基于在一些实际应用中观察到的类似渗透的过程。
图1表明,一旦与LCC断开连接,系统节点就会失去功能。根据提出的模型,考虑到渗透特征以及与系统依赖性相关的局部和全局负载动态的联合影响,探索了混合级联故障。该新模型捕捉了不同依赖网络系统中级联故障的一些基本特征以及有关负载动态的恢复过程,从而大大提高了其适用性。当一个故障的系统节点i被恢复时,一些负载被假设从其功能邻近节点和同一集群中的依赖节点转移回节点i,这些节点之前在节点i故障时接收了来自节点i的负载。这一假设有助于理解具有负载动态和多依赖的网络系统中的故障传播机制和恢复过程。
2.2. 本地客户负载和路过负载的建模
在我们的模型中,在电力系统的案例研究中,假设节点的本地客户负载主要取决于连接到该节点的客户数量,而路过负载则取决于该节点的程度。一个节点的客户连接越多,往往会导致该节点上的客户负载需求量越大。更高的节点度,当系统节点与LCC断开连接时,会发生功能故障。度有助于更大的路过负载。节点i在t0时刻的初始负荷Li(t0)表示为:
式中,Pci为节点i连接的归一化客户数(0≤Pci≤1)。对于电力系统,Pci包括从系统节点i接收电力的所有客户。Pdi为节点i的归一化度(0≤Pdi≤1)。基于经验观察,一些现实世界的网络系统,对于电力系统,Pic 包括从系统节点 i 接收电力的所有客户。Pid 是节点 i 的归一化度数 (0 ≤ Pid ≤ 1)。根据实证观察,一些现实世界的网络系统(如电力系统和通信网络)的初始节点负载分布呈现出不同的形式,并随着时间的推移而变化[45,46]。与 CASCADE 模型 [43] 类似,假设任意节点 i 上初始本地客户负载 Li,c(t0) 和初始通过负载 Li,d(t0) 的基线服从具有特定负载范围 [Lmin, Lmax] 的截断正态分布,如下所示:
其中Li, x(t0)表示Li,c(t0)或Li,d(t0)。公式2中截断正态分布的μl和σl的取值被限制在特定的范围内,以供案例研究。采用非线性容量-负荷模型对网络节点容量进行量化。节点i在时刻t Si(t)的状态如公式3所示,考虑过载失效和渗流失效,
式中Ci为节点i的容量,LCC(t)为节点在t时刻属于LCC的节点集合,Si(t) = 0表示节点i在t时刻正常,Si(t) = 1表示节点i在t时刻失效。混合级联失效建模为后续工作提供了基础。
图2所示的电力系统是一个典型的相互依赖的网络系统。系统依赖不仅存在于系统组件之间,而且由于电力传输,大容量电力系统与配电系统之间也存在系统依赖。具有动态负荷再分配的级联恢复过程描述如下:
其中**ΔL i,j,c(t)**表示节点i在时间t发生故障时平均分配给其工作依赖节点j(即节点j不失效)的节点i的本地客户负载量。ki,c(t)是与节点i处于同一依赖集群的工作节点集合,即节点i的依赖节点;Li,c(t)表示节点i在时间t失效时的本地客户负荷。
类似地,ΔL i,j,d(t)表示节点i在时间t发生故障时,节点i平均分配给其工作邻居节点j的经过负载量。如果节点i和j之间存在直接连接,则它们是邻居。ki,d(t)为节点i在时刻t泛函的相邻节点的集合。Li,d(t)为节点i在时刻t失效时的路过负载。
在我们的模型中,节点i的工作邻近节点和依赖节点,在节点i故障时接收了节点i的负载,如果节点i恢复,将把负载传递回节点i。例如,节点i在时间t发生故障,那么它在时间t´恢复。在此工作中,在时间t '时,恢复节点i上的本地客户负载Li,c(t ′ )和路过负载Li,d(t)可以为计算式如下:
PM 均匀分布在 (0,1) 中,决定了从节点 M 转移回恢复节点的负载量。它表示节点负载恢复级别的不确定性。这些工作相邻节点或工作依赖节点上的负载根据转移回恢复节点的负载量而减少。NFc 表示节点 i 的一组工作依赖节点,其中在时间 t′ 的本地客户负载大于 ΔLi,j,c(t),即,这些节点上有足够的本地客户负载在时间 t′ 转移回节点 i。NDc 表示节点 i 的一组工作依赖节点,这些节点没有足够的本地客户负载在时间 t′ 传输回节点 i。同样,NFd 和 NDd 用于表示节点 i 的工作相邻节点集,在两种情况下,这些节点位于时间 t′ 。假设节点 i 上不会有通过负载,该节点在时间 t ′ 修复,但在时间 t 或时间 t′ 没有工作的相邻节点。方程。(6) 和 (7) 是通过考虑如何将两种类型的负载转移回恢复节点来确定恢复节点上的负载。
总体而言,考虑了与系统依赖性相关的局部和全局负载重新分配的联合影响,开发了一种新的混合级联失效模型。系统依赖性不会立即导致依赖集群崩溃,而是通过影响负载共享间接加速过载故障传播。节点负载由本地客户负载和传递负载组成,根据系统特性具有不同的动态分配机制。在以下示例中,新模型用于将输电系统中级联故障的影响扩展到配电系统。它有助于研究系统强化和针对级联故障的恢复措施的效果之间的相互作用。
3. 系统加固与恢复的联合优化
本节将系统加固与恢复措施结合进行同步优化,以减轻级联故障的影响。与系统加固相关的投资通常包括增加冗余组件、获取系统和故障事件信息等成本。了解系统特征,例如操作细节和服务信息(例如,每个系统节点为满足客户需求而提供的负载量),有助于强化资源分配,以减少系统脆弱性和潜在损失。系统加固的有效性取决于多种因素,如组件加固优先级和加固级别。修复行动还涉及多重成本,例如维护维修人员的成本。修复效能属于不同决策,如维修优先级和维修人员调度。恢复决策作为中断后的响应,旨在减少系统中断的影响,并将系统恢复到期望的状态。在实际情况中,级联故障通常会造成经济损失,而用于系统加固和恢复的投资预算有限。因此,关于弹性损失的CCP约束被纳入到最小化总成本的目标函数中。总成本包括恢复成本、加固规划的信息获取成本和级联故障造成的经济损失。这样,系统加固和恢复的联合优化就可以满足具有经济可行性的弹性要求。
在系统运行期间,由于计划外的变化或操作条件的变化,会发生不确定的中断事件。在这个问题中定义并考虑了具有不同干扰的场景。系统干扰由随机向量 U 表示,其中 U = (U1, U2, …, Uk),其中包括 k 个不同的干扰因子,例如干扰类型和严重性,这些因子在实践中都与随机的物理事件有关。在我们的示例系统中,初始系统中断严重性是我们考虑的唯一干扰因素,它由最初发生故障的系统组件的数量来评估,因此 k = 1。此外,U1 是随机干扰严重性,U1 ∈ {u1,u2,…,ul,…},其中 ul 表示情景 l 的初始干扰的特定严重性。在案例研究中,最初失效的系统组件被归结为随机的内部失效。初始组件故障越多,干扰越严重,这往往会触发更剧烈的故障传播。
3.1. 问题表述
(1)硬化费用
访问系统操作信息(例如,反映组件重要性的系统组件工作负载)有助于有效强化资源部署。对于前面提出的电力系统模型,需要投资来收集连接到大型电力系统中系统组件(即变电站)的客户信息。根据与指示组件工作负载的每个系统组件关联的客户级别数据,可以选择性地执行系统组件强化。具体来说,系统组件强化降低了组件的初始故障概率及其在我们的模型中的恢复时间。因此,获取更多的客户信息(这需要在信息收集方面进行更多投资)有助于更有效地强化组件。硬化成本 Cin(Φ(φ, ρ(ω))) 定义如下:
Φ(φ, ρ(ω)) 是决策者可用的强化度量值集。变量 φ 表示特定的强化策略,使用优先级首选项对要强化的系统组件进行排名。ρ(ω) 是包含所选系统组件的强化级别的向量,这取决于连接到相应组件的客户信息的可用性。Ω 表示强化范围,即考虑强化的系统组件总数的百分比。在这项工作中,硬化程度决定了组件初始失效概率和修复时间的减少。ρd 表示节点 d 的硬化级别,0 ≤ ρd ≤ 1。Oφ,ω 是根据强化策略 φ 和强化范围 ω 选择进行强化的节点集。系统中存在 Kc 类型的客户,nd,k 是连接到节点 d 的 k 类客户的数量,Cikno 是收集 k 类客户信息的成本,假设是固定的。节点 d 的强化成本与连接的客户数成正比,并由强化级别 ρd 考虑。
(2)恢复成本
在我们的模型中,雇用班组修复故障节点的成本称为恢复成本。成本取决于许多因素,例如恢复策略(对故障节点进行修复优先级排序)以及雇用的维护人员的数量。场景 i 的恢复成本 Cir(Φ(φ, ρ(ω)), Π(π, c), ui) 定义在公式9
Π(π, c) 是可用恢复度量的集合。π 表示恢复策略。c 表示已租用班组的数量。假设 cr 维护人员在正常情况下被保留。雇佣每个正规船员进行维修的费用是每单位时间的 Crb,而额外的船员(超过 cr)可以以更高的成本和更低的工作效率来雇佣,具体定义如下公式10
Crv 表示随着已雇用班组数量的增加,每单位时间的增量雇用成本。Crf 是雇用第 f 个机组人员的每单位时间的实际成本。li,f 表示场景 I 中第 f 组执行的总修复时间。由于 li,f 受情景 i 中系统扰动严重程度 ui 的影响,加固措施 φ, ρ(ω) 和恢复措施 π, c,因此恢复成本也受这些因素的影响。
(3) 经济损失
对于电力系统,当发生级联故障时,客户可能会因系统组件(如变压器和输电线路)跳闸而与系统断开连接。由于客户的电力需求不再得到满足,因此会导致经济损失。经济损失 Closi(Φ(φ, ρ(ω)), Π(π, c), ui) 表示如下,
(4)纳入弹性约束的目标函数
具有干扰严重性 ui 的情景 i 的总成本可以表示如下:
总成本包括用于信息收集的强化投资、雇用工作人员的恢复成本以及客户离线时的经济损失。情景 i 的 CCP 约束结合弹性损失要求由下式给出
其中 vi 是情景 i 中的 CCP 约束,0 ≤ νi ≤ 1。θi 是情景 I、0 ≤ θi ≤ 1 的弹性损失要求。在情景 i 中,弹性损失 Ri(Φ(φ, ρ(ω) ), Π(π, c), ui) 与目标系统性能相关 。更少的弹性损失是更可取的。级联恢复过程中的弹性损失主要取决于加固和恢复措施以及系统中断。在案例研究中,功能连接到电力系统的客户数量被用作评估弹性损失的系统性能指标。它反映了与客户可访问性相关的系统服务级别。
与以前的研究不同,在以前的研究中,弹性损失测量和 CCP 约束分别用于评估弹性增强,本研究首先尝试将 CCP 约束与弹性损失要求相结合纳入目标函数。为此,应用了 Karush-Kuhn-Tucker (KKT) 方法,该方法将约束优化问题转换为无约束优化问题。新变量 λ 是拉格朗日乘子,在问题中引入这些乘子以形成一个新的目标函数,即广义拉格朗日乘子。所有考虑的情景下的广义拉格朗日定义如下:
其中 FS = {ε; γi(Φ(φ,ρ(ω)),Π(π,c),ui) ≤ 0, i ∈ {1,2,…,I}},这是满足弹性约束的可行解集。在新的优化问题中,弹性损失变得与成本有关,因为它会影响最小化的总成本。KKT 乘数 λi 表示违反情景 i 的 CCP 约束时的惩罚权重。
3.1.1强化策略
用于强化或恢复的有效资源分配的基础是确定重要的系统组件,因此在这项工作中考虑了具有特定强化和恢复优先级偏好的策略。下面讨论了三种强化策略
(1) 大量客户连接节点首次强化 (HCFH):系统节点根据连接到系统节点的客户数量按降序排列和优先级排序,以实现强化顺序。客户连接越多,表示系统节点提供的服务越多。
(2) 高度节点优先加固 (HDFH):根据节点度对系统节点进行排序和优先级排序。节点程度越高,表示在传输系统负载时节点的重要性越高。程度越高的节点具有更高的 HARDENIZED 优先级。
(3) 高负载节点优先加固 (HLFH):根据系统节点的负载对系统节点进行排名和优先级排序。较高的节点负载表明节点在传输系统负载和满足客户负载要求方面的重要性更高。负载较高的节点具有更高的优先级。
3.1.2恢复策略
还原策略π根据其修复顺序对失败的系统节点进行排名。排名靠前的节点将优先修复。考虑的恢复策略如下:
(1) 高度首修 (HDFR):对于尚未开始修复的故障系统节点,按节点度数降序修复,即节点度数较高的网络节点优先修复。
(2) 短时首修 (STFR):故障节点的修复顺序由其所需的修复时间决定。该策略优先考虑需要较短修复时间的故障节点。
(3) 高负载首次修复 (HLFR):修复优先级由故障节点承载的负载量决定。修复活动尚未启动的故障节点将按先前通过节点的负载量的降序进行修复。
(4) 先失败先修复 (FFFR):修复失败的节点遵循它们失败的顺序。这是默认的还原策略,用于比较目的。
(5) 大量客户连接节点首次修复 (HCFR):尚未开始修复的故障节点将按照连接到节点的客户数量降序进行修复。连接客户较多的网络节点具有更高的修复优先级。
(6) 最快客户修复 (FCR):故障节点的修复是根据单位时间内重新连接电源的客户数量排序的,即客户重新连接电力系统与节点修复时间之比最大的故障节点优先修复。
当尚未开始修复的失败节点具有相同的特性(例如,相同的程度)时,根据 FFFR 断开了平局,因为修复操作必须遵循确切的顺序。修复活动一旦开始,在完成之前不会停止。可能还有其他更实用的硬化和恢复策略,但所采用的策略有助于说明硬化和恢复联合优化的效果。
3.2. 基于仿真的优化
主要的模拟步骤,包括中断前硬化、级联故障和中断后恢
复,如下图所示:
步骤1)建立网络Net(N, M),获取初始LCC并建立依赖簇。
步骤2)分配网络节点容量[20],并实施加固措施。
步骤3)初始化节点故障。失败的节点及其连接的边都是非功
能性的。
步骤4)故障节点负载在更新后的网络结构上局部和全局分布。
过载节点失去功能,不属于LCC的系统组件也失去功能。
步骤5)故障节点由机组人员根据修复决策进行修复。
step6)回到step4,直到系统性能恢复到预定水平。