通信世界网消息(CWW) 互联网金融企业的数据中心布局切不可头脑过热,大范围建设,而应该借鉴互联网公司“集约化布局”的大思路,规模不大时在全国两三个城市部署就可以。
特约撰稿人 蹄马
互联网金融被人们称为目前“最火的互联网业务”。我们不必细数到底有多少家从事互联网金融的相关公司,仅从手机应用商店里那琳琅满目的理财APP,就能感受到该业务的火爆程度。但近期笔者却看到互联网金融出现“冰火两重天”的现象。
“冰火两重天”体现在:一方面互联网金融企业决策者层面的高瞻远瞩,很多互联网金融企业高层都计划建设数据中心;另一方面,IT基础设施团队存在“选择困难症”。这“冰火两重天”的距离需要拉近。一家互联网金融企业是否要建设数据中心以及如何建设数据中心,应从以下四大方面考虑。
厘清业务发展需求
选择数据中心的布局,首先需要清楚业务需求是什么,其实在这一点的考虑上,互联网金融公司的出发点与互联网企业没有区别,都是要保障用户覆盖质量。
那么从用户覆盖质量出发,其实很容易找到的判断依据就是我们的“眼球”分布在哪里,把内容追随眼球尽可能放到近的地方。表1是从CNNIC于2016年1月22日发布的《第三十七次中国互联网络发展状况统计报告》中摘录出来的数据,截至2015年12月,中国网民规模达6.88亿,互联网普及率为50.3%,网民数量排名如表1。
表1 我国网民数量排名
从排序来看,中东部和沿海地区省份/直辖市的“眼球”规模领先,按照互联网普及率排名看,北京、上海、广东、福建、浙江等位居前列,在规模允许的情况下,我们就可以在这些地方进行布局。
未来随着移动上网设备的不断普及、“宽带中国”战略的不断推进,我国互联网发展的地域差异将进一步减小。除了考虑网民规模和普及率高低外,还要考虑该省份/直辖市的骨干网络能力,承载宽带用户接入能力、连接骨干网络的能力、覆盖周边乃至全国其他省份的网络能力和质量,这些数据从何处来?一般看过运营商骨干网扩容规划就可得知。
在中东部和沿海地区建数据中心不环保,目前数据中心也呈现西迁的趋势。从绿色环保的角度看,中东部和沿海地区在常年气温带来的自然制冷效益、风能及核能等廉价能源等方面的确不太合适,但是从近几年的实践经验看,数据中心西迁的必要条件,也就是基础网络的建设必须要跟上来,通过笔者实践观察,运营商的重视程度仍然需要提高而且还需要时间。
另外,在数据中心西迁的过程中,业界应将目标聚焦在BAT之类的大型互联网企业也就是资源需求大户上,并且互联网企业可以先尝试把容灾或数据计算的业务搬过去,待西部省市的网络建设跟上了,再把时延敏感的业务迁移到西部。因此目前来看,互联网金融企业还是采用“追随眼球”的数据中心布局策略更为合适。
参考互联网同行业的数据中心布局历程
数据中心如何布局?我们可以回顾参考一下当前BAT之类的大型互联网公司走过的路。其实互联网公司起步时,大家的选择都差不多,无非从一两个机房起逐步扩张,业务发展得快,就导致机架和服务器的需求爆发式增长。例如腾讯拥有数万台服务器时,大部分服务器都位于一个城市,分散在该城市的数十个机房,每个机房都只有几十个机架,这个阶段面临的主要问题就是业务部署在这些零散分布的服务器上,其间的网络随需建设而复杂无章,一个业务逻辑可能要穿越好几个机房,复杂且效率低,网络细微的变动对业务都会产生显著的关联影响。初期采用的这种部署方式是可以理解的,谁又能料到一个互联网公司和业务的发展如此迅猛呢?
后来,一方面,业务发展仍然带来超高速的机架需求,同时业界普遍意识到不能把机房全都放在同一个城市,再加上此时,得益于云计算战略在各个地方政府的支持下发展,各地如雨后春笋般闪现出大量的数据中心,此时腾讯开始尝试一些异地的中等规模机房。该过程面临的问题是,业务分布到另外一个或几个城市去,并不是一件容易的事情,其中一个就是网络问题,这并不是新迸发出来的问题,只是比原来在一个城市中时更加严重而已,而且组网成本飙升。
图1 数据中心部署阶段及时间
待腾讯发展到一定规模,良好的规划性就该发挥作用了,实施资源集约化,将原来各地的中小机房陆续裁撤掉,聚集在全国3或4个大点,每个点至少20万台服务器,中间租用运营商资源组网成DCI骨干网,将网络的接入能力延伸到必要的地区。这个布局让公司真正享受到了集约化带来的运营效率提升、规模化成本优化、业务布局规范性等诸多好处,更关键是对最关键目标也就是用户覆盖的最高效实现。
那么再往后,的确是该从绿色环保的角度出发考虑问题了,数据中心需考虑能源节约的问题。随着政府的支持和引导、三大运营商的实际投入,我们也已看到在内蒙古、贵州等地超大数据中心基地的建成,BAT等大型互联网公司也都在尝试如何将合适的业务部署到这些区域。虽然另一个关键点“超强扁平化网络”的实现还需要一段时间。但笔者坚信数据中心布局未来的发展方向将是“从多地/多中心到集约化布局”,如图1所示。
业务自身要具备适应多中心布局能力
腾讯在资源布局“走出XX城市”这一步时,业务部署面临了比较大的挑战,这也对互联网金融公司具有参考意义。
在金融界比较流行“CAP理论”,其中Consistency(一致性)、Availability(可用性)、Partition tolerance(可分区性)三者不可兼得,所以对于数据一致性要求高的金融业务而言,在整体系统可用性方面和可跨网络区域方面必然打折。想象一个业务容灾分布到相距近千公里的两个城市数据中心去,其间网络延迟数毫秒,如何实现数据强一致性?这就是为什么银行普遍采用“两地三中心”的布局,即使这样的布局,可用性方面顶多也就实现《GB/T 20988-2007信息安全技术信息系统灾难恢复规范》中的第5级,也就是恢复时间/RTO“数分钟至2天”、恢复时间点/RPO“0至30分钟”。
而互联网公司和第三方支付等业务普遍降低了对数据一致性的要求,通过一些技术手段实现最终一致性,这时方能在全国多数据中心中布局,腾讯的QQ空间、即时通信经过较长时间也实现了全国三地部署和灵活切换,微信业务也实现了“两地六园区”的容灾部署。
运营成本和能力建设是持续投入
全国多中心的布局看上去固然“高大上”,如果从以上几个因素分析都是有必要的,那么请互联网金融决策者做好准备,选择并建设完机房,还有网络需要建设。一个数据中心间互联网络(DCI)规模不够时,要承担长途专线每G需要每月2~4万元的租赁费用,并且还要组建团队,更关键的是长期的运营成本很可能居高不下。所以动手建设数据中心前需要先让IT负责人想明白,集中运营与属地化管理结合、DCI网络建设和运营、业务和基础设施容灾切换能力建设等一系列问题如何解决。