作 者:爱立信(中国)通信有限公司
时间进入21世纪之后,人类的日常工作、生活都与通信建立了密不可分的联系。然而频频发生的自然灾害以及许多人为事件,往往会影响到电信网络的正常运行,所以电信行业在强化网络升级和业务创新的同时,急需对突发事件的管理给予足够的重视。
灾害应急需要常备不懈
2008年年初,华南地区发生雪灾,直接经济损失超过1000亿元,移动运营商有数万基站中断服务;2008年5月12日,四川汶川发生大地震,直接经济损失达8451亿元,已确认的死亡人数接近7万人。震区的通信网络也多次陷入瘫痪,并在主震发生初期一度影响了抗震救灾的组织工作,为此运营商和通信厂商都调派了大批设备和人员赶往现场抢修。
除了自然灾害以外,还有许许多多不可预料的突发事件,会对通信系统的安全造成严重影响。比如恶意攻击、硬件损坏、空调等辅助系统损坏、电力等市政设施发生故障、人为的破坏、偷抢以及工作人员发生意外等等。如果说突发事件造成的直接经济损失还可以计算的话,由此带来的对运营商品牌和声誉上的损失就无法估量了。比如近期国内某航空公司飞行员罢工引起业务中断,在广大乘客中产生了非常坏的影响,这种影响会潜移默化地改变客户的行为,进而损害企业的长期利益。
为了降低这些不可抗拒的灾害、突发事件对电信业务的影响,运营商可以考虑采用国际上流行的业务连续性管理(BCM)模型,来强化自身的防灾减灾能力,提高灾后恢复业务的速度。据统计,出现大的灾害事件之后,没有做业务连续性计划的企业中,只有10%能够存活下来。
业务连续性管理以体制对抗灾害
业务持续性管理(BCM)并不是什么新鲜的概念,已经被许多西方企业采纳到日常经营当中。业务持续性管理其实就是一种整体管理流程,先确定可能对企业正常运作造成影响的威胁,然后有一整套方法来建立一个体制架构,从而阻止或有效抵消这些威胁,保证灾害期间企业能够尽可能减少损失,灾后企业能够尽快恢复业务,以保护企业的利益和声誉。
国际上流行的BCM模型由6个关键部分组成,也可以看作6个步骤。第一步是深入理解企业自身的情况,找出企业赖以生存的关键,通过风险评估和业务影响分析来发现会危及这个“关键”的问题,估算可能造成的损失,并给出可以接受的业务恢复时间。比如电信运营商的骨干传输网和一个基站,可以接受的业务恢复时间肯定是不同的。第二步是制定BCM策略,即在深入理解企业情况的基础上,根据企业的运营目标、资源和成本来制定BCM策略,选择能够降低风险的措施。第三步是开发和实施BCM应对方案,方案中应包括人员职责分配和培训、计划的启动条件、应急程序、支援机制、灾后复原程序等。第四步是让BCM融入企业文化,在企业内部形成一个持续的管理、协调与监督的过程,从而实现业务连续性管理的目标。第五步是有计划地按照BCM应对方案进行演练,保证计划能够顺利执行,同时还要根据演练中发生的问题不断加以改进。第六步是制定有关政策和保障制度,完善BCM项目群管理。
最后一个环节并不是业务持续性管理活动的终结,企业所处的环境总是在变化的,而BCM模型也会从许多方面改造企业,所以完成第六个环节之后,企业需要进入第一个环节,展开新一轮的自我革新。这样周而复始地进行下去,企业对突发事件的应对能力将逐步提高。
丰富经验帮助BCM成功实施
2008年的南方雪灾和汶川地震已经表明,运营商必须要高度关注BCM。而爱立信认为,BCM要取得成功,人是关键。不但负责提供咨询服务的外部人员需要有丰富的经验和知识,运营商本身的BCM执行人员也需要有足够的技能,确保在压力下也能完成关键性的任务。这些都需要运营商在平时投入大量的时间和精力,把BCM融入到公司文化中,使所有员工能够完全理解BCM的精髓,只有这样,企业才能在灾难来临时按事先制订的方案来迅速恢复业务。业务恢复越快,突发事件对企业的影响就越小,而且还可能因为恢复较快而赢得竞争优势。
爱立信在BCM方面有丰富的经验和实践,可以在规划、准备、方法论以及技术方面为运营商提供咨询服务。作为全球最大的通信设备供应商,爱立信对各种电信业务都有深刻的理解,对运营商的网络和服务也有非常全面的认识,能够帮助运营商分析BCM在业务方面的挑战,定义或者提炼出BCM战略,开发、实施BCM方案并提供后续的维护、改进服务,从而提高运营商BCM能力。
专家级服务久经实践考验
欧洲一家运营商在规划BCM项目时,很快就选中了爱立信的BCM咨询服务。他们主要看中了爱立信是通信领域的专家,拥有解决紧急情况的第一手资料,能够为整个项目提供专家级的技术支持和指导意见,而且已经为全球众多的运营商成功实施了BCM项目。
此次项目涵盖了多个方面的内容,包括话音呼叫的硬件设备和环境,数据采集系统的环境、I/O处理和重要记录、网管中心的软硬件以及报警系统、分组业务方面的IP骨干网、GPRS设备的软件硬件等,另外还有应用层设备、呼叫中心和公司的对外沟通方案等等。爱立信充分利用电信网络领域的丰富经验,为这家运营商制定了完善的BCM方案和切实可行的紧急预案细节。
例如,在紧急情况发生的时候,网络的话务量会急剧上升,如果没有做好相应的措施,会导致系统瘫痪。爱立信建议在紧急事件发生时,启动设备负荷控制机制,包括MSC和BSC内的CP负荷控制,A接口负荷控制,寻呼流量控制,MGW负荷控制。同时,基于爱立信在电信业的长期实践经验,提供了降低网络负荷措施的一系列建议,如分流用户、延长周期性位置更新时间、缩短MSRN保留时间、延长信道分配尝试之间的时间、减少手机自动重发信道请求的次数、调整CP负荷控制的门限值、检查命令输出的设置、关闭IMEICHECK、预防BSC中可能出现的PCH拥塞等等。
在项目中,爱立信提出利用电信设备的功能和特点,在网络方案中采纳适当的技术来增强运营商对灾害的应变能力。比如建议建设MSC/SGSN/MGW/HLR池组,开启用户分级接入功能,部署低功耗基站,实施“无线本地连接”方案,实施Abis优化技术,部署一体化机房,以及加强部署微波传输,采用微波对部分有线链路进保护等等。
为国内运营商量身定制BCM方案
截至目前,爱立信已经为多个国际领先的电信运营商成功实施了BCM咨询项目,包括欧洲的沃达丰、德国电信、意大利电信、西班牙电信等,这些成功经验对于国内运营商非常有借鉴价值。
爱立信在为中国运营商提供BCM服务时,会主要从四个维度来考虑。首先是参考国际标准的BCM规范和流程,包括参考BSI发布的BS25999、ISO/IECJTC1SC 27发布的ISO/IEC 13335、ISO/IEC 17799、27000系列以及NIST的一系列FIPS标准和NIST特别出版物800系列等。其次是讲求让BCM与电信技术相结合,并利用爱立信为世界各地运营商执行灾害恢复的经验,为中国客户提供网络和技术建议。第三是充分借鉴爱立信在全球多家先进运营商的BCM咨询项目中积累的经验,服务于国内运营商。第四是不但要考虑企业的商业运营,还要与国家相关政策法规的要求相结合,帮助运营商更好地承担起自身的社会义务和职责。