首页 >> 通信技术 >> 技术滚动 >> 正文
 
IT基础架构的“变与不变”
----通过标准化管理技术解决网管中心发展中遇到的问题
http://www.cww.net.cn   2010年12月18日 13:47    通信世界网    
作 者:中国移动通信集团江苏有限公司 陆旻 吴翔 庆祖良

5 实现备份设备的高可用

目前各机房都有磁带库设备,但任何一个磁带库设备的故障,尤其是可能的严重故障都将导致其所在机房的备份作业停顿,进而可能影响生产系统正常运行(如数据库日志无法正常归档),解决方法是实现带库设备跨机房的共享,即各机房服务器平时主用本机房的磁带库,当本地带库发生故障时,可以使用其他机房的磁带库承担本地的备份任务,这样实现了带库设备的冗余。

6 实现备份数据异地保存

数据备份到本地磁带库后仍然存在一定的数据丢失风险,包括火灾等机房级别的灾难可能造成存储和带库同时损坏,另外如磁带本身的损坏也可能造成数据无法恢复,其他如本地磁带库故障可能造成紧急的数据恢复要求无法得到满足,解决这些问题的方法是在机房之间进行磁带库的复制,将本地机房当晚的备份数据在固定的时间点集中通过Vault功能复制到另一个机房的磁带库,相应的另一个机房当晚的备份数据在固定的时间点集中通过Vault功能复制到本地机房的磁带库,磁带复制作业安排在白天进行将避免与晚上的密集备份作业的冲突。

7 建立统一的恢复演练平台

恢复演练必须要有独立的服务器环境来进行异机恢复,用生产系统服务器进行恢复演练,即使恢复到不同的数据库实例,也有太多的不安全因素,可能影响生产系统。缺省使用裸设备的数据库在恢复时必须恢复到相同数量和大小的裸设备,在多个数据库共享一个恢复演练环境时会造成空间的浪费和工作量的增加,所以采用了在恢复服务器上使用大容量的文件系统,通过定制RMAN恢复脚本等,将裸设备的数据库恢复到文件系统,这样就可以方便多对一的恢复。

8 实现备份的集中监控和分析

为了有效管理备份和恢复基础架构,系统必须提供完备而灵活的报告功能。包括以下重要内容:证明重要数据的可恢复性、将遵从 RTO 和 RPO 要求的情况进行归结、分析风险并量化所有威胁,以及评估系统和应用程序的可恢复性。对这些内容进行归档之后,可以轻松生成自动报告,并将这些报告通过电子邮件发送给管理员或业务主管。

三、 实施效果及评估

统一备份管理平台上线以来备份成功率达到了99.9%,数据恢复成功率达到100%, 高端备份资源得到了全面的共享,备份系统真正实现了以服务的形式来提供,覆盖了所有的业务系统,同时维护人员的工作量却下降了。

标准化存储管理平台建立了一个统一的存储基础架构,将异构存储硬件及不同档次的存储硬件纳入到存储池进行管理,通过一个接口实现存储资源的统一分配,存储利用率比以前提高了20%,同时实现了阵列级的冗余高可用,使得当前系统可以抵御曾经多次发生的阵列级硬件故障,将整体系统可靠性提升了一个层次。统一存储分配和异构硬件的竞争也带来了硬件成本的极大下降,对于集采可能引入的异构硬件可以来之即用,纳入到现有的统一平台中,统一的运维管理提高了运维人员的专业性,也意味着提高了运维的效率。

[1]  [2]  [3]  [4]  
相关新闻
编 辑:石美君    联系电话:010-67110006-818
分享到新浪微博 分享到搜狐微博 分享到网易微博 分享到139说客 分享到校内人人网 分享到开心网 分享到QQ空间 分享到豆瓣 分享到QQ书签       收藏   打印  进入论坛   推荐给朋友
文章评论查看评论()
昵称:  验证码:
 
重要新闻
通信技术
企业黄页
会议活动