作 者:
李新苗 在当前融合业务的需求下,电信运营环境对BOSS系统的容灾能力要求有了进一步提升。运营商容灾的风险主要有两大类:一类是运维过程中可以预见的业务中断,如系统升级、系统割接或运营商机房迁移引起的系统中断;另一类是由不可控因素引起的计划外中断,如火灾、水灾、地震等引起的严重系统故障。
据某第三方统计数据显示,相当多的风险源于人为故障,如操作错误或操作失误;还有一些源于恶意攻击,如病毒引起的严重系统故障等。这些因素占各种风险的39%。因此,更需要在BOSS系统中做好容灾备份工作。
一份规划两个指标
日前,中国惠普有限公司TSG通信及媒体行业专业服务部解决方案经理王耀航就运营商与业务支撑问题面临的风险回答了本刊记者的提问。
王耀航认为,根据电信系统对抗风险能力和容灾能力的要求,单一的产品或解决方案不能解决根本问题,而是通过一份完整的容灾恢复规划(即业务连续性的规划)来完成。通过针对客户进行的业务风险分析,确定客户有哪些风险需要应对,用何种方式能够达到相应级别的业务连续性。针对不同的应用和要求,业务连续性有两个重要指标:一是恢复时间目标RTO(RecoverTimeObjective),二是恢复点目标RPO(RecoverPoint Objective)。这两个指标对具体实施方案的成本影响巨大。比如CRM这类系统一旦出现问题,将导致大量的客户订单丢失,直接影响客户满意度,使收入下降。
三种备份方式
王耀航表示,针对运营商不同的需求,BOSS容灾有3种实现方式。第一,从运维方式看,BOSS容灾可分为主备方式和负载分担方式(国内也称为双中心,即两个系统都在同时处理业务),比如计费,不同系统分别处理来自不同地区的话单。第二,从业务连续性的级别看,BOSS容灾可分为数据、应用及业务等三个级别。第三个角度是实现的技术,其中一个关键点为数据复制的方式。因为要实现灾备,首先要保护数据,这需要使处于运行生成状态一方的数据与待机状态的一方保持同步。
同步最基础的备份方式是通过物流系统,将数据送到另外一方保护起来,以前多采用这种方式。这种方式恢复时间比较长,磁带备份过程中丢失的数据也较多,因此此种方式对关键应用或收入影响比较大的应用就不适用了。
基于磁盘阵列的复制是较为高级的备份方式。惠普的XP高端存储和EVA存储,都具备磁盘复制技术。它能把应用服务器或应用主机上的每一个字节全部复制到对端去,这样就保证子系统的所有数据能即时写到备份系统上。
另外,在操作系统级别,有基于逻辑卷、数据库以及应用软件的复制技术。复制技术的效率决定着系统的恢复时间和恢复点,因此要想在相对短的时间内快速恢复系统,选择合适的复制技术非常重要。基于磁盘阵列的复制技术在BOSS领域应用较多;在主备系统距离较远的(500公里以上)情形下,则常采用基于应用软件的复制技术。