首页 >> 第四届中国通信网络运维年会 >> 20日论坛直播 >> 正文
图文:美国力登中国区技术部经理周里功
2008年11月20日 17:38    通信世界网    评论()    

    通信世界网(CWW)11月20日消息今天,由中国通信企业协会主办,中国通信企业协会通信网络运维专业委员会、北京中通运科技有限公司、中国通信运维网承办的“第四届中国通信网络运维年会”在北京南粤苑宾馆隆重召开。通信世界网作为本次大会的独家特邀媒体支持单位,将会对本次会议进行全程、深入报道。

    图为美国力登中国区技术部经理 周里功

    周里功:各位下午好!

    从早晨到现在已经是会议时间拉得比较长,我是最后一个,我会在尽可能短的时间结束,让大家回去好好休息。

    其实,力登公司一直在运营商领域里面跟运维的部门有着非常紧密的结合,无论是合并之前的四大运营商,还是现在的三大运营商,他们的运维部门其实都在使用力登解决方案,尤其是运维里面经常用到的带外管理、无人机房的系统都在用我们的解决方案。我今天给大家交流的题目,主要是关于数据中心的用电方面的。

    我刚从台湾地区开会回来,又听说Google要建一个数据中心,是要在海洋里面建造。因为我们现在的数据中心面临一个很大的挑战,一个是没有电,有一个是没有空间了。没有电的最主要的原因,除了我们的设备需要电力支持,还有一个耗电量非常大的就是空调的制冷,所以在海洋里面建数据中心,可以解决制冷的问题。第二点,没有空间是因为我们数据中心很大,所以在海洋里面建数据中心也不存在空间的问题。

    在座的各位如果以前关心过数据中心,或者是参加过关于绿色节能相关的会议,可能大家看过这方面的数据,我就不做细致的解释了。一个结论是,现在的电费对于数据中心来说是很大的挑战,我们都需要探索一些道路,无论是从运维的角度还是运营的角度,如何来降低能耗,来提高生产力。

    这张图是IDC的报告,它给我们展示出了在一个数据中心里面到底能耗是怎么样的。平时,作为咱们的运营商的机房的管理者,老总每个月可以看到,这个月机房是几万块的电费。但是,如果深究进去,到底我这些钱用在哪里?比如说我的制冷用了多少,我的IT设备用了多少,我的服务器的耗电比例是多少,我实际的供电量和我服务器实际的负载关系是怎么样的。这些,在今天其实还是在大多数的数据中心没有准确的数据。原因是什么呢?因为我们当今的数据中心的用电管理,其实还是有一些盲区。它的盲区在哪呢?当今的数据中心的用电管理,其实除了由供电局拉过来电力有一个总的电表,大多数的数据中心没有一个细致化的用电测量。虽然现在每一个数据中心在每一个机柜上有了测量方式,但是这些测量方式往往是不够的,我们需要捕捉的数据中心测量的盲点在哪呢?就是对于末端设备的测量。也就是说,在数据中心里面我们想要降低用电,提高数据中新用电的效率,必须要提高末端的用电管理,就是端到端的用电管理。

    那么,为什么要提高端到端的用电管理呢?因为我们要实现数据中心的节能减排是有一个模型的,这是一个简单的应用模型的图。发展到今天,业内无论是厂商还是一些研究学者,他们认为对于当今数据中心节能的模型归类为三大模型。一个是要实现精细化的管理,我可以做到对于数据中心单点的设备能够实时的测量,这样我可以找出我耗电多少,以及环境也是做精准的测量,可以找出哪些地方是热点。第二点是制冷的送风,是要在制冷的送风上做一些优化,这主要是因为在我们的数据中心里面制冷和送风耗电的比例,已经占到了55%或者是更高。比如说国内很多的数据中心,可能有60%都是电耗在送风上。第三点叫做虚拟化和智能化,虚拟化和智能化的改造主要是针对数据中心的IT设备,比如说我们的服务器和存储设备要做改造。在存储设备里面耗电量80%的设备,只有对它们虚拟化和智能化才能大幅度的降低耗电。

    要想降低三方面的节能模型,有一个关键点就是核心,我们要在测量、诊断的过程中达到端到端节点的测量。达到节点的测量,我们就可以对于单台数据中心和达台设备电流和有效功率的测量,对于不同机柜内的温湿度的测量,或者是可以到实时的耗电度数和二氧化碳的排放情况。

    当我们有了这样的测量数据以后,我们才可以做出诊断,比如说我建立出我整个数据中心功率能耗的图表,或者是温度和湿度的立体图表,还有我数据中心的指导图,比如说我这个月的电费2万元,我下个月的电费是2.5万元,我们可以精细地测量出这个电费的增加是由哪个区域的哪台设备导致的。

    所以,在测量和诊断的意义,对于我们运营商的数据中心来说,不同的人员意义也是不同的。比如说我们的运维人员,当我们对IT设备有了具体的测量,我们可以实现针对IT设备的用电的阀值和告警。比如说他的用电阀值在某一个阶段,如果高出这个阶段就是出现告警。对于数据中心的经理来说,通过这种测量阶段,我们可以真实地了解到我机房实际能耗的情况,我可以建立出我自己数据中心能耗的基线,这样可以精准地计算出我实现节能的手段前后的PUE的变化情况。对于我们的决策层,我们有了精整的测量,我们可以给我们的老总提供一份报告,我们也可以列出精细的数据中心的电费统计,到底哪个部分用电比较高,而且还可以回顾一下我数据中心从响应国家的节能减排这一块的进展状况。

    所以,基于这样的业内目前对于数据中心节能的趋势,力登公司推出了几个解决方案,这个解决方案比较简单。它的原理是我们利用数据中心里面有一个标准的设计叫做PDU,Raritan公司把这个PDU智能化,而且达到它可以有一个测量的探头,所以在数据中心我们进行了末端数据的采集。在集中管理这一块,我们有一个叫做Power IQ的软件,它把所有的末端的数据收集上来,做一些统计和分析。所以,这就是它的一些原理。这次会议,我们也有一个展台,在外面也带了一些相关的产品,各位在茶歇的时候可以看到这些产品,它可以做到实时的IT设备的监测。比如说我具体的耗电量的统计,包括一些数据,我不同服务器的电流、有效功率、功率因素等等可以输出报表,我们可以做一些分析。

    像这张图我们可以分析这四个应用的服务器,在一个月里面功率的成长情况。从这张图表可以看得出来,Web服务器的用电量在向上走,路由器、有线的服务器是比较平稳的,这对于我们工作的分配可以提供有意义的报告。

    做一套这样的系统,对于我们数据中心的价值是什么呢?第一点是跟我们的运维直接相关的,因为做到了用电的端到端的管理,我们可以提高数据中心设备的可用性,这就是我们运维人员最终的目标。所以,它大概分为这么几点。

    第一点,对于设备的用电量监控,这样可以在设备故障发生之前起到预防的作用。第二点,PDU除了有远程监控还有电源开关的功能,对于机房冷启动的时候,我们可以在异地对于这些设备进行冷启动的操作,这样可以保障系统可持续性的运行。第三点,可以实现设备两端供电的管理。举个最简单的例子,我们可以把在数据中心里面空的没有插IT设备的插座,都设置为断电的状态,这样可以消除一些人为的因素。我们经常拿一些系统到机房里面测试,这个时候我需要把这个设备加电,但是当你把新的设备加到PDU上面,我相信我们大家谁都不知道这个PDU的负载是怎样的。所以,有可能人为的因素导致PDU的负载跳闸,用这个设备可以实现所有空的插口实现用电的管理,你申请的时候可以给你开关不同的PDU。此外,因为它是智能的PDU,所以有来电的延时配置,避免因设备同时加电引起的瞬间电流峰值导致的断电跳闸。此外,由于有对机柜内微环境的温度和湿度的监控,这样我可以试试地掌握到数据中心每个机柜内温度的变化,避免由于设备功率过高或者是湿度过潮导致的宕机。所以,这套系统对于我们运维的帮助也是非常大的。

[1]  [2]  编 辑:张翀
关键字搜索:力登  技术部  
[ 本站暂时关闭评论 ]
 
  推 荐 新 闻
  技 术 动 态
  通 信 圈