作 者:中国电信股份有限公司上海研究院 张文隽 沈雷
近几年,中国电信运营商都开始大规模建设软交换网络。软交换网络和传统PSTN的一个很大区别是从电路交换转变为分组交换,其承载网络从传输网络转变为IP分组网络。这种转变在网络和业务上给运营商带来各种优势的同时,也对维护提出了一些新的挑战。其中,软交换和承载网关联性故障的处理就是一个困扰软交换网络维护的主要难题。
软交换和承载网关联性故障是指故障现象体现在交换侧,但实际故障点在IP承载网上网络故障。软交换网络运行中已发生过多次相关故障,故障影响大、处理难,已成为相关维护部门普遍面临的问题。
关联性问题分析
目前软交换网络和IP承载网仍是松耦合关系,这种松耦合具体体现在两个方面:首先体现在维护管理上,往往由不同的团队分专业维护管理,由不同的网管系统监控,且IP网维护时往往只考虑了原有上网和专线数据业务的特点,未考虑话音这种实时业务的特征,其对承载网端到端服务质量的变化,缺乏相应的手段;其次体现在技术上,软交换网络在业务层缺乏感知承载网端到端服务质量的有效手段,承载网发生故障或服务质量劣化时,软交换无法及时准确告警并切换。
由于这种松耦合关系,造成设备和网管上都缺乏详细准确的告警信息,且故障主要处理人员一般仍为交换专业人员,造成运维人员对故障处理不知如何下手,严重影响故障修复的效率。
同时,软交换网络相比于原有PSTN网络,由于采用了IP网络作为其承载网络,其在承载和业务故障关联上也体现出不同的特征,具体如下。
——交换侧保护切换能力方面:PSTN网络中交换机能感知TDM传输问题(如中断、滑码)并切换,而IP网络只能感知与承载网物理层中断情况,不能感知承载网QoS的变化,因而软交换网络也无法根据承载网络QoS变化进行切换。
——承载网保护切换能力方面:PSTN网络中传输设备能根据中断、滑码进行保护切换,保护切换能力较强,而IP网络只能根据物理层中断进行切换,无法根据QoS变化进行切换,导致IP网络板卡非中断故障容易影响软交换业务。
——故障定位手段方面:TDM网络中传输协议较简单(主要是物理层),依靠自环等简单维护手段就能快速定位,而IP网络中涉及应用层等协议,快速定位软交换还是IP承载问题较困难,造成软交换网络中难以快速区分软交换还是IP承载故障。
——语音质量方面:PSTN网络占有话路后即独享带宽,而IP网络中所有用户共享带宽,使得基于IP承载的软交换网络难以保障语音可靠的带宽。
——语音传送的颗粒度方面:PSTN网络中使用2M和155M的接口传送业务,颗粒度较小,而基于IP网络的软交换网络流量集中,核心设备多以GE口传输,业务颗粒度较大,使得一旦发生承载网故障对业务量的影响巨大。
——网络维护指标方面:PSTN网络中定义影响10万用户小时即为网络重大故障,而IP网最高服务标准(金牌客户)为4小时故障修复时间,使得承载网中认为较小的故障,在软交换网络中就提供语音业务而言将成为重大故障。
由于这些差异,相对于原有传输网故障对交换网的影响,IP承载网故障时对软交换网络的影响更大,且我们不能借用PSTN原有的一些故障处理方法和经验来处理软交换和承载网的关联故障。这就需要维护部门针对软交换承载特点,从维护作业制度和维护手段创新,一方面尽量降低软交换和承载关联故障发生的概率,另一方面提升应对软交换和承载关联故障处理的效率。
应对措施建议
软交换和承载关联性问题涉及的原因较复杂,许多技术性问题和支撑手段也不可能在短期得到解决,因此建议相关维护部门在不同的阶段,根据不同的条件,采取不同的应对措施。
(一)、短期应对措施
短期应对措施的目的是降低软交换承载故障发生的概率,缩短承载层故障发生后故障处理的时间,避免故障范围和影响面扩大,建议采取以下措施:
——开展网络自查,减少故障隐患;
——优化软交换设备和网管告警信息;
——增强承载网的透明度;
——将软交换CE设备统一纳入数据维护部门统一维护;
——对软交换和承载网保护切换方式进行梳理,确保其保护切换的协调性;
——总结故障现象,优化故障处理流程,部分故障情况下建议相关部门并行同步处理。
(二)、中期应对措施
中期应对措施的目的是对于承载网络质量和故障能做到监测系统自动发现、实时告警,维护人员主动处理,在大范围用户受影响前业务能恢复正常。主要方式有建立承载层的全程质量监测系统和软交换综合告警系统。
——建立承载层的全程质量监测系统针对现有承载网缺乏端到端服务质量监控手段的问题,建议通过部署探头的方式,建设承载层的全程质量监测系统,对软交换承载网端到端连通性及服务质量进行实时监测。
——建立软交换综合告警系统目前现网软交换和承载网通过各自的网管系统对设备实施管理,系统告警仅输出至自身网管,在发生问题时,维护人员需要综合查看多个系统后进行故障关联分析判断,影响故障处理速度。针对该问题,建议建设软交换综合告警系统,将软交换设备和承载网设备以及信令监控、承载监控等辅助系统的告警予以集中呈现,并将实现软交换和承载网故障关联,在网络发生问题时能将故障点快速呈现,引导维护人员及时处理。
(三)、远期应对措施
远期应对措施的目的是对于网络故障承载层设备能自动发现、实时告警、自动切换,将影响面降到最小。主要措施有:
——在软交换业务全程质量监测系统的基础上,增加对设备切换控制功能,使其能够通过检测结果,控制软交换系统和承载网设备的切换。
——要求承载网设备厂商根据所承载的实时性业务(如语音、传真、视频、IPTV等)的特点改进设备,提供流量监测、流量控制、网络指标监视、告警通知、路由自动切换等方面的功能。
分组网的承载方式增加了软交换网络维护的难度,但我们也不能由于这些维护上的困难否定软交换网络的应用成果,目前维护部门可通过故障处理方法的完善和维护经验积累减少故障发生的概率,提高故障处理效率。但最终要解决承载网故障对软交换业务的影响,还需要不断完善软交换系统,使其能感知承载网故障和服务质量的变化,从而在发生承载网故障时能快速切换,减少对业务的影响。