通信世界网讯(CWW) 1、背景 随着企业业务数据的激增,传统备份方式下,要保存生产数据的多个副本拷贝,导致备份容量会越来越大,造成对备份系统管理困难和成本上升。
然而,备份系统中存在的多个生产数据副本之间,存在着大量的冗余重复数据。因此,对于备份系统,重删技术的应用可以很好的消除冗余数据,极大节省备份空间,从而降低采购和运维成本。
2、华为OceanStor VTL6900重删方案
华为集中备份解决方案采用OceanStor VTL6900作为备份设备, VTL6900通过FC SAN或者IP SAN连接备份服务器,应用组网如图1所示。
图1 VTL集中备份方案
华为 OceanStor VTL6900虚拟带库是业界唯一的集群重删备份系统,同时支持Post processing和Inline的重复数据删除技术,其重删引擎为SIR(Single Instance Repository)。
2.1 Post processing重复数据删除方案
VTL6900所支持的Post processing重复数据删除技术,其数据比较方法为索引比较方法。
Post processing重复数据删除技术原理
图1 VTL集中备份方案
在Post processing重复数据删除模式中,VTL6900软件包含两个模块:VTL模块和SIR模块。VTL6900的存储空间逻辑上被划分为两部分,分别为VTL模块和SIR模块所用,称之为VTL存储空间(又称为Cache)和SIR存储空间(又称为Repository)。VTL6900接收到备份数据后,首先将其存放于VTL存储空间,此后的某个时刻(如某时间点、备份结束、达到存储水位等),SIR模块会读取这些数据,并将其和SIR存储空间中的已有不同数据块进行比较:SIR模块将原始备份数据划分为大小为若干KB的数据块,然后使用SHA-1算法为每个数据块计算出一个哈希值(又称为索引/Index),通过比较新数据块和已有数据块的哈希值以确定新数据块是否重复,重复的数据块将被丢弃,而仅保留其数据块指针,全新的数据块才会被存放到SIR存储空间。
2.2 Inline重复数据删除方案
VTL6900所支持的Inline重复数据删除技术,其数据比较方法也为索引比较方法。数据重复数据删除执行过程,如图2所示。
|