如今,尽管人们使用有效性来衡量数据中心有其好处,但并不能有效地提高数据中心的效率。IT团队需要更详细的数据中心指标,包括能源和冷却基础设施,以及计算系统,以真正优化数据中心。
谈到在这一方面的进展,2007年美国环境保护局发布了一份关于数据中心效率的报告,其中指出希望发布名为“能源之星”(ENERGYSTAR)的服务器评级标准,尽管后来实现比预期的要晚一些,他们还是完成了这一标准的制定。GreenGrid公司早在2010年公布了水的使用效率和碳使用效率指标,但是并没有引起人们太多的关注。2016年6月,GreenGrid宣布的性能指标(PI),一个着眼于将冷却标准与能源效率结合起来进行评价的指标。
人们已经习惯于用性能和效率的指标来评价数据中心的性能,然而对于多数IT团队来说,甚至是一些日常跟踪能源使用效率(PUE)的团队来说,启用新的评价指标无疑需要更高端的数据收集以及分析技巧。对于那些已经准备好使用更加复杂优化工具的团队来说,有一些关键内容需要事前考虑。
拓展数据中心评价指标
关闭空闲的服务器、整合和虚拟化应用程序,购买符合能源之星评级的硬件等方法来节约能源是常见措施。然而,除非能源和冷却的基础设施同样完成优化,这对现有的系统较为困难,否则降低的消耗将无法显着提高能源效率。这时PUE数据将变得更糟。通过以PUE为基准,而不作为跟踪度量,指标数据很可能看起来很糟糕,这样投资和付出是不值得的。管理者只希望他们的投资能带来较低的PUE数值,而没有理解数字本身所代表的意义。
这就是其他数据中心所采用的评价指标,如GreenGrid的数据中心能源效率(DCeP)都是有价值的原因。DCeP将完成有效工作时,数据中心实际产生的能量消费的数据进行了量化。DCeP允许用户建立自己对有效工作指标的定义。例如,网络在线搜索公司可能会以其网站完成的搜索数量作为定义内容。而对于零售商来说,定义内容很可能是销售数量。PUE还是必要的,然而DCeP指标能更容易被一些经验较少的人们所理解。
尽管DCeP不是一个科学准确的度量角度,它提供了一种方法来量化你真正完成工作时所使用的能源。如果一家银行的服务器在大部分时间里都处于空闲状态,它描述出最小能量,所需的最少的冷却量,并不会显著地影响PUE.但它仍然消耗了能力却没几乎没完成任何工作。DCeP则正相反,其目标是减少能源消耗,大限度地提高有用的工作。对于行业中的领先企业,要将每一点的生产性计算从他们使用的每瓦功率中挤压出来,复杂的服务器可以提供远远超出了处理器利用率的操作数据,而更为复杂的数据中心度量可以跟踪结果。
然而PUE和DCeP还都只是有关能源效率和降低能源。使用它们衡量效率,可能造成部分无法识别的结果,因为这些指标无法显现出在节省能源、影响冷却性能和可靠性方面所作出的牺牲和让步。新的性能指标度量指标则可以做到,对于那些拥有更高水准数据收集技能的、有能力去优化运营过程中每个环节的管理员很有帮助。
性能指标度量的四个层级
性能指标度量有四个层级。Level1是基本层级,不需要复杂的设备就可以应用。Level2需要更彻底、更准确的测量。Level3和Level4添加计算流体动力学(CFD)的空气流建模来提供性能监控的图形可视化,还提供假设情景分析,预测使用当前能源效率时,未来的能力和故障模式是如何的。Level3是普通建模。Level4使用实际和详细的测量方法,校准计算流体动力学模型作为其他标准可信赖的准确度量基线。
要使用性能指标(PI)和数据中心能源效率这样的标准拓展数据中心度量有三个前提;
采用PUE方法;
在计算操作中定义哪些工作是有效工作的
获取每个机架工作时产生的能源、温度等详细测量数据
性能指标将PUE、热合规性和弹性结合起来补充现有的度量方法。后两者分别基于ASHRAE推荐标准和允许的热度范围。热合规性和弹性研究如何在正常和异常条件下保证冷却工作的冗余。如果机房空调空气温度必须降低到满足热合规目标,PUE可能增加。性能指标度量的侧重点是要了解硬件是如何可靠地被冷却,以及能源设施的效率如何,以及一个因素如何影响其他因素。决定你距离想达到的极限距离有多少,以及你想要的目标能源效率或PUE值。然后,测量实际情况并绘制一张三角形的图,也称为蜘蛛图,看看他们是如何接近你的目标。
现在有几种衡量数据中心的指标,依据能源效率,计算每单位能源消耗和可靠性相对能源效率的工作输出,以大限度地提高整体数据中心的性能。对于大多数运营工作来说,坚持基本设施和跟踪电源使用的有效性应处于最优先。可以选择其他标准,但PUE仍然是基础。即使人们还没有准备好采取进一步的措施,了解行业中成熟的建议还是有帮助的,只要有了目标就能知道应该如何去做。