“水能载舟,亦能覆舟”,这句千百年来警示统治者的治世名言,对于众多大型企业数据中心来说似乎同样适用。虽然众多企业都拥有经验丰富的数据中心管理者,发生“倾覆”的概率很低,但被日益汹涌的用户“洪流”撞击致伤的概率却很高,且每一次“撞击”的损失都惨重。
据权威数据统计,大型数据中心没发生一次业务中断至少造成50万美元以上的损失。而全球每年每500个大型数据中心就有1个面对严重的宕机事故,有 40%的公司每年需要1天时间进行数据恢复,有7%的公司需要超过1天的时间。另有45%的被调研公司每年花费20万美元提供灾备措施以应对昂贵的业务中 断损失。
面对如此高发、高损失的数据中心灾害,是否有可靠的解决办法呢?近年来,随着应用交付的深入应用,让众多大型企业数据中心看到了保障业务永续、提升品牌价值的希望。
大型数据中心的“灾害”之源
大型企业数据中心的应用价值不言而喻,其所受到的重点照顾和重点保护也毋庸置疑,那么在层层保护之下,为什么数据中心还是会频繁的发生这样那样的事故呢?
对此,太一星晨产品工程师傅羿伟表示,由于数据中心部署难度大、需要处理的数据信息异常庞大复杂、以及各种突发性状况等多种因素,使得“数据中心之间”和“数据中心内部”潜藏着多种“灾害隐患”,甚至可以用“内忧外患”来形容。
在数据中心之间,最初的单一数据中心虽然解决了数据集中的问题,但容易造成数据丢失不可挽回的情况,容易使企业遭受经济损失和名誉损失的双重打击。 之后采用的主备数据中心,虽然解决了数据容易丢失问题,但是资源浪费严重、利用率低、且恢复数据的时间很长,还需要复杂的流量主备机制部署。
为了避免上述弊端,众多企业开始采用双活/多活数据中心部署方式。通过这种方式部署的数据中心应用稳定性、可用性大大增加,但目前还缺乏相对成熟的解决方案,并且部署的难度非常高,也会使数据中心在承载应用服务的时候潜藏不少未知的隐患。
如果说数据中心之间的灾害隐患受困于数据中心的部署方式和当前行业的技术条件限制;那么在在数据中心内部满足服务需求所面临的隐患挑战,则源自复杂外部应用环境和多种多样的用户需求特征。
在数据中心内部,从用户访问到应用服务的这一过程中,制约用户体验的部分主要有两大时间构成:一是网络传输的响应时间,二是业务数据的生成时间。
在网络传输的响应时间内,主要有以下因素影响用户的体验:首先,应用手机的移动用户,在访问应用服务时需要通过窄带传输,那么数据中心如何更好的满 足窄带传输,就是保障用户体验的关键;其次,用户跨运营商访问应用时,由于不同运营商网络之间的传输效率差,也会导致效率低下问题;此外,突发性的网络中 断也常常也会常常发生,严重影响用户的连续性应用需求。
而在业务数据的生成层面,首先受困于服务器自身性能瓶颈,服务器性能较低必然会影响应用服效率;同时,系统内部应用服务优化较差,也会大幅降低服务能力;再加之不可预知的服务器宕机因素,让数据的生成过程潜藏多种隐患。
此外,在数据中心服务用户需求的整个过程,还要全程防范网络安全攻击行为,一旦发生,一旦发生安全问题,造成的灾害影响更大。
|