作 者:电信网技术 胡昌军
摘要首先提出公众电信网应急通信系统的相关流程,然后对每个应用流程进行了分析,给出各个流程中涉及到的技术研究内容,最后指出了公众电信网应急通信面对的挑战。
1、引言
2007年8月30日,全国人大常务委员会通过了“中华人民共和国突发事件应对法”,其中第33条规定:国家建立健全应急通信保障体系,完善公用通信网,建立有线与无线相结合、基础电信网络与机动通信系统相配套的应急通信系统,确保突发事件应对工作的通信畅通。由此可以看出国家对于应急通信系统建设的重视程度。
应急通信一般是指在出现自然或人为的突发性紧急情况时,为应对紧急情况而综合利用各种通信资源实现通信的机制。根据不同的应用场合,应急通信系统主要有以下两种不同的类型:
(1)保障和支撑公众电信网运行安全的应急通信系统。当通信网设施遭受破坏、性能降级、异常高话务量或特殊通信保障任务情况下,主要由运营商采取必要的应急措施,能够及时恢复国际、国家、地区或本地的通信能力。
(2)城市应急联动系统CERS(CityEmergencyResponseSystem)。城市应急联动系统就是综合各种城市应急服务资源,采用统一的号码,用于公众报告紧急事件和紧急求助,统一接警,统一指挥,联合行动,为市民提供相应的紧急救援服务,为城市的公共安全提供强有力的保障。
本文将重点对第一种应急通信系统的相关实现流程进行探讨,并对流程中每一阶段可能涉及到的主要技术进行阐述。需要说明的是,本文中涉及到的应急通信系统,主要是指为保证公众通信网正常运行而采取的各种措施和手段。
2、公众电信网应急通信系统的基本工作流程
从工作流程看,公众电信网应急通信系统从准备到启动可以分为两个阶段:
(1)在故障或灾难发生之前,主要需要完成两方面的工作,一是对现有网络进行抗毁性分析,发现网络存在的弱点,评估网络的鲁棒性(Robust);二是制定网络应急预案,以应对网络中可能出现的突发状况。
(2)在故障或灾难发生之后,主要需要完成三方面的工作,一是在故障或灾难发生之后,对网络中出现的故障点能够进行快速定位;二是对网络通过自愈能力进行恢复的评估;三是在网络全部或局部无法进行自恢复的情况下,启动应急预案。
图1所示为公众电信网应急通信系统相关流程。本文针对两个阶段五个方面的工作流程分别进行讨论。
图l 公众电信网络应急通信系统相关流程示意图
2.1网络抗毁性的分析
网络抗毁性分析是指对整个通信网络的安全可靠性进行深入分析研究,预判在发生重大网络故障或灾难时对网络的影响程度,是制定通信应急预案的基础。
(1)在进行网络抗毁性分析时需要完成的主要工作
●根据实际网络现状,借助一定的工具(如网络故障评估分析软件),完成网络抗毁性分析。
●在网络抗毁性分析时,必须遍历网络所有故障点,给出相应的分析报告,为实际网络故障时采取的具体应急手段和规模提供依据。
●根据抗毁性分析结果,可以提出相应的网络优化建议,作为制定相应的通信应急预案的依据。
(2)在网络抗毁性分析方面需要进一步研究的内容
●网络故障评估分析软件的开发,能够手动或自动运行网络抗毁性相关分析软件。
●“两点或多点故障”模拟评估功能研究。目前的评估分析软件在支持“两点或多点故障”模拟方面还存在一定的不足,需要尽快完善评估分析软件相关功能。
●增强网络抗毁性分析的智能化功能,能够自动实现网络受损严重程度的评估。
2.2通信应急预案的制定
应急预案是公众电信网应急通信系统的重要组成部分,制定周密、完善、合理的通信应急预案是应急通信系统建设的重要一环。通信应急预案的制定应遵循以下原则:
(1)应在网络抗毁性分析的基础上,制定通信应急预案。
(2)根据网络故障或灾难的不同影响程度,存在多种级别的应急预警(注),应根据不同的应急预警级别,制定相应的应急预案。
注:根据《国家通信保障应急预案》,预警级别可以分为4级。
●Ⅰ级:因特别重大突发公共事件引发的,有可能造成多省(区、市)通信故障或大面积骨干网中断、通信枢纽楼遭到破坏等情况,及需要通信保障应急准备的重大情况;通信网络故障可能升级造成多省(区、市)通信故障或大面积骨干网中断的情况。
●Ⅱ级:因重大突发公共事件引发的,有可能造成该省(区、市)多个基础电信运营企业所属网络通信故障的情况,及需要通信保障应急准备的情况;通信网络故障可能升级造成该省(区、市)多个基础电信运营企业所属网络通信故障的情况。
●Ⅲ级:因较大突发公共事件引发的,有可能造成该省(区、市)某基础电信运营企业所属网络多点通信故障的情况;通信网络故障可能升级造成该省(区、市)某基础电信运营企业所属网络多点通信故障的情况。
●Ⅳ级:因一般突发公共事件引发的,有可能造成该省(区、市)某基础电信运营企业所属网络局部通信故障的情况。
2.3故障快速定位
故障快速定位是消除网络故障的前提,是保证网络安全的重要前提。在网络正常运行时,可以通过通信网络自身的网管系统,对实际通信网络运行状态进行实时监测。在故障发生之后,能够利用告警相关性分析和网管相关技术,对故障进行快速定位,从而为故障排除和网络恢复提供准确及时的信息。为了实现网络故障的快速定位,需要进一步做好以下两方面的工作:
(1)运营商需要建立一个上层统一的网管(或故障相关性分析)系统、物理层网络资源监测系统、机房环境监测系统等,能够实时监测和分析各个专业子系统的网络故障,从而真正实现故障的快速准确定位。
(2)应该加强网管方面的研究,一方面是加强相关专业网管标准和网管功能要求等方面的研究,目前数据网、接入网的网管不是很完善;另一方面是加强各个专业网管之间的沟通。对于应急通信系统来说,目标是在告警层面实现各个专业统一网管以能实现故障相关性分析功能,依据设备及相应的网管系统来实现数据的采集。
2.4网络恢复程度的评估
对于公众电信网,网络自身均有较强的自愈能力,在一般故障条件下,可以利用网络自愈能力实现网络的自动恢复。在故障或灾难发生之后,特别是影响面较大的故障发生后,利用网络自身的自愈能力可能无法对所有中断的业务进行恢复。在这种情况下,应该利用某种工具对网络的恢复程度进行评估。网络恢复程度的评估是后面启动应急通信系统预案的前提,通过网络恢复程度的评估,可以掌握故障或灾难对网络的影响程度,从而为下一步采用何种应急预案提出建议。