经管视界

网站首页 > 新闻中心 > 经管视界 > 正文

拦截故障的多米诺骨牌:赵吉昌博士谈级联失效的时空传播模式与应用前景

发布时间: 2017/05/04 10:12:44     点击次数:次   打印本页

随着人类社会的发展,诸如信息网络、交通网络和电力网络等基础设施的可靠性正面临着来自各类威胁的愈发严峻的挑战。仅从某个局部故障开始,级联失效能够以多米诺效应的方式传播,从而导致在现实生活中时常听说的大规模网络瘫痪。比如2015年3月,土耳其超过半数的省份遭遇大停电事故,对交通、航空、居民生活用电等方面均造成巨大且不可恢复的损失。相似的级联失效也可能发生于信息网络。2014年1月,从腾讯公司服务器崩溃开始,中国超过三分之二的DNS服务器在极短的时间内发生连锁故障,导致大量网页不能被用户访问。这些级联故障大都在传播初期难以被发现,并往往以不可预见的方式快速传播,导致维护者难以对其进行精准的预测和控制。

从故障原因的角度来说,一些故障源自结构的相关性,而另外一些故障则是由于过载。与第一种故障不同,由于系统内的交互作用,过载故障常常通过不可见的路径传播。在结构性失效中,故障传播依赖节点在网络中的直接连接,而过载失效则通过传播路径的变化造成更多节点过载并失效。这种具有蝴蝶效应的级联过载失效甚至能从一个微小的扰动发展成灾难性的破坏。然而不幸的是,虽然上述故障的时空传播特性至关重要,对其在学术上的研究到目前仍是空白。因此,这也成为了复杂网络可靠性中的一个重要问题。

本项研究关注空间嵌入式网络中由于局部故障导致的级联失效。这种初始时仅发生于局部区域的故障在自然灾害和恶意攻击中十分常见。在模拟不同阶段级联失效传播的快照后,研究的主要结果展示,级联失效在空间传播的速度几近恒定。随着系统容忍能力的上升,级联失效传播速度持续降低,也即大的容忍能力可以延缓系统的崩溃速度,带来更长的防控窗口。除此之外,也进行了理论建模。比较了模拟结果和理论计算结果,证明建立的理论模型能够很好地估计级联故障传播的速度。

在200*200的晶格网络上展示了第一、三、五、七阶段级联传播情况。abcd四幅图中,深蓝色节点代表在当前一个阶段当中刚刚失效的节点,黑色节点代表本阶段之前就已经失效的节点,青色的节点代表目前尚未失效的节点。

同时,以这些结果为桥梁,甚至可以将级联失效传播问题与依赖网络渗流模型关联起来,也即不同特征长度的依赖链接可以作为更为简洁的模型来描述级联过载失效。建立该关联的重要意义在于,级联失效往往需要大量计算,极大的限制了所能研究的系统规模,而依赖网络渗流的讨论则仅需要较少的计算,使得讨论极大规模网络成为可能。

在实际应用中,当一个网络中扰动被检测到时,级联失效时空传播特性的相关知识对于预测和抑制网络故障不可或缺。与此同时,也需要注意到,现实系统中的级联失效常常源自不同动态过程如过载或操作的复杂交互,因此从该意义上讲,本文亦是探索级联失效背后所隐藏普适规律的万里长征的第一步。

论文链接:https://www.nature.com/articles/ncomms10094

赵吉昌:2014年毕业于北航计算机学院,在情绪计算和情绪传播方面的相关工作曾得到MIT Technology Review和BBC等媒体的报道,并在Journal of Computer-Mediated Communication等刊物上发表了信息传播方面的论文。