本文中,来自蒙特(Munters)的Keith Dunnavant和来自维萨拉(Vaisala)的Anu Kätkä将描述数据中心领域的未来走向,并讨论暖通空调测量对能源效率的影响。随着能源成本不断攀升和各国政府迫切寻求减少温室气体排放的机会,数据中心能效成为国际关注的焦点。
两位作者在数据中心的能源管理方面均拥有长期的经验和丰富的专业知识。蒙特是为包括数据中心在内的关键任务流程提供节能和可持续气候控制解决方案的设备生产厂商,而维萨拉是天气、环境和工业测量领域的设备生产厂商。
一、数据中心能耗
全球对电力的需求量约为20,000太瓦时;ICT(信息与通信技术)行业使用2,000太瓦时,而数据中心使用大约200太瓦时,占总量的1%。因此,数据中心是多数国家和地区能源消耗的重要部分。据估计,全球的数据中心有超过1,800万台服务器。除了自身的电力需求外,这些IT设备还需要配套的基础设施,例如冷却、配电、灭火、不间断电源、发电机等。
为比较数据中心的能效,通常的做法是使用“电源使用效率”(PUE) 作为衡量标准,即数据中心使用的总能源与IT使用的能源之比。理想情况下的PUE为1,这意味着所有能源都用于IT,而配套基础设施不消耗任何能源。
因此,要更大限度地降低PUE,就需要减少冷却和配电等配套基础设施的消耗。现存传统数据中心的PUE 通常约为2,而大型超大规模数据中心可达到1.2以下。2020年,全球平均水平约为1.67。这意味着平均而言,总能耗的 40%是非IT消耗。然而,PUE是一个比值,不能体现能源消耗总量,这意味着如果IT设备相比冷却系统消耗的能源水平较高,则PUE看起来会很低。因此,衡量总功耗以及IT设备的效率和生命周期也很重要。此外,从环境的角度来看,还应考虑发电方式、消耗的水量(包括发电和现场冷却)以及是否利用废热。
PUE概念最初由绿色网格联盟(Green Grid)于2006年提出,并于2016年作为ISO标准发布。Green Grid是一个开放的行业联盟,由数据中心运营商、云提供商、技术和设备供应商、设施架构师和终端用户组成,致力于在全球范围内提高数据中心生态系统的能源和资源效率,努力降低碳排放。
PUE仍然是计算数据中心能效的常用方法。例如,在蒙特,PUE是根据每个项目的峰值和年化基础进行评估的。在计算PUE指标时,在PUE的计算中仅考虑IT负荷和冷负荷。这称为部分PUE (pPUE) 或机械 PUE (PUEM)。电气工程师使用峰值pPUE来确定最大负荷以及备用发电机的大小。年化pPUE用于评估一年的典型耗电量,并与其他冷却方案进行比较。虽然PUE可能不是一个完美的工具,但随着WUE(水利用效率)、CUE(碳使用效率)等其他衡量标准以及SPUE(服务器 PUE)和TUE(总 PUE)等可增强PUE相关性的方法的采用,PUE得到越来越多的支持。
二、数据中心趋势
在过去十年中,高效的超大规模数据中心在数据中心总能耗中的相对份额有所增加,而许多效率较低的传统数据中心已经关闭。因此,总能源消耗尚未明显增加。这些新建的超大规模数据中心专为提高效率而设计。然而我们知道,由于人工智能、机器学习、自动化、无人驾驶汽车等许多新兴趋势的涌现,对信息服务和计算机密集型应用程序的需求将会不断增长。因此,数据中心的能源需求预计会有所增加,而增加多少则是争论的焦点。在最理想的情况下,与当前需求相比,到2030年全球数据中心的能源消耗将增加三倍,但更有可能增加八倍。这些能源消耗预测中包含了IT和非IT基础设施。大部分非 IT 能源消耗来自冷却,或者更准确地说,来自服务器的散热,仅冷却成本就可轻松占据年度总能源成本的25%及以上。毫无疑问,冷却是维持IT功能的必要条件,并可以通过设计优良、运行高效的建筑系统来优化。
近期的一个重要趋势是服务器机架功率密度增加,有些甚至高达30至40千瓦及以上。根据数据中心专业人士行业协会AFCOM进行的研究,2020 年数据中心状态报告表明,平均机架密度跃升至每个机架8.2 kW,高于2019年的7.3 kW和2018年的 7.2 kW。约68%的受访者表示,机架密度在过去三年中有所增加。
向云计算的转变无疑推动了超大规模和托管型数据中心的发展。从历史上看,一个 1兆瓦数据中心的设计初衷是为了满足银行、航空公司或大学的需求,但许多机构和公司现在正在转向超大规模和托管型数据中心设施内的云服务。随着这一需求的不断增长,对数据速度的要求也越来越高,所有这些数据中心都服务于关键任务应用,因此,基础设施的可靠性至关重要。
同时,人们也越来越关注边缘数据中心以减少延迟,还采用液体冷却来应对高性能芯片,并以此来减少能源使用。
三、温度和湿度控制
对于提升风冷数据中心冷却能效,首要考虑的因素之一是热通道/冷通道温湿度控制。遗憾的是,许多现存数据中心的温湿度控制系统仍然没得到妥善管理,导致能源效率低下。而另一方面,新的数据中心建设往往非常重视温湿度控制,这对提升性能大有裨益。
在大多数情况下,送风温度介于24 °C和25.5 °C之间时较为理想。然而,热通道和冷通道之间的温差 (delta-T) 至关重要。通常,delta-T约为10至12 °C,但在数据中心设计中通常将目标定为14 °C。delta-T的提升会带来两方面的收益,即减少冷却系统所需的风扇电机能耗,以及增加实现节能散热策略的潜力。
四、数据中心温度变化
节能是利用室外空气促进数据中心部分散热的过程。节能可以直接发生,即室外空气经过适当的空气过滤,直接引入冷却系统并输送到服务器;节能也可以间接发生,即再循环的数据中心空气通过空气-空气热回收器排入环境。这能降低成本并提高效率和可持续性。但为了保持效率,应尽量减少由于过滤导致的空气侧压下降。因此,如果空气在数据中心内进行再循环而不引入外部空气,则应该可以减少或完全消除对过滤的需求。
冷却和通风需要精准控制,重要的是配置高效风扇,保持建筑物的微正压并控制室内湿度。例如,新风系统应将空间露点控制在足够低的水平,以便冷却螺旋管仅进行显冷,而不必处理潜热负荷(降低空气湿度)。
排热系统的总体目标是保持IT设备的最佳状态,同时尽可能减少能耗。例如,湿度低会增加静电风险,而湿度高会导致冷凝,进而对电气和金属设备构成威胁,增加故障风险并缩短工作寿命。已有证据表明,高湿度水平与各种环境污染物相结合会加速服务器内各种组件的腐蚀。
为避免过热和防止故障,必须通过冷却来消除IT设备产生的热量。根据一些研究,相较于稳定的高温,温度快速波动实际上对IT设备的危害更大,因此从这一角度来看,控制回路至关重要。
新的IT设备通常能够在较高的温度下运行,这意味着可以提高进气温度,且这更有助于实现自然冷却和节能。如前所述,室外空气可直接或间接用于冷却室内空气,而蒸发或绝热冷却可进一步提高节能效率。随着不消耗水的干排热策略日渐流行,上述这些节能技术已得到广泛应用。由于热提取介质(气体或液体)温度升高,有效利用数据中心废热的潜力也随之增加,比如可以将废热用于区域供热网络。例如,在芬兰赫尔辛基,微软(Microsoft)和能源集团富腾(Fortum)正在合作开展一个收集余热的项目。微软数据中心将会使用100%无排放电力,同时富腾把服务器冷却过程中产生的清洁热量传输到与其区域供热系统相连的家庭、服务和商业场所。该数据中心废热回收设施或是世界上同类设施中最大的。
瑞典蒙特集团销售副总裁Keith Dunnavant
五、准确监测的重要性
在许多现代设施中,正常运行时间预计占99.999%;这意味着每年只有几分钟的停机时间。由于IT基础设施处理的数据和流程十分重要且富有价值,良好的性能必不可少。
数据中心设计的一个关键特性是为服务器提供正确的温度,而这只有在控制系统使用精确传感器的情况下才能实现。机房越大,可能越难以监测,因为它们的空间温度更有可能发生变化,因此应配备足够数量的温度传感器来确保监测到所有服务器,这一点非常关键。
有些服务器可能距离冷却装置较近,有些则较远;有些可能在机架底部,有些则在较高的位置,因此存在发生三维变化的可能性。因此,除了装配足够数量的传感器外,确保在整个服务器机房中妥当放置冷却装置且气流通畅也很重要。通过将适当的设计和监控结合,可以有效地控制冷却和气流,从而满足所需的规范。
为了评估不同变量对年均能耗的影响,蒙特在三个不同的位置建立了系统运行模型,以三种不同的控制应用模型运行;每个系统都有一个1兆瓦ITE负载的数据中心:
基准案例(案例一)中,设计供给温度为24 °C,回风温度为35 °C (delta-T = 11 °C)。
案例二中,供给和回风温度降低1 °C(delta-T保持不变)。
案例三中,仅将回风温度降低1 °C(delta-T降低)。
结果显示,在气候较温和的位置,三种场景的能耗均较低。案例二显示,供给和回风温度降低 1 度,能耗增加 1%至2%。案例三中仅将回风温度降低 1 °C(从而降低 delta-T),能耗显著增加——三个位置的能耗都增加了8%至9%。由此可见,温度的小幅偏差就能产生很大的影响,这恰恰凸显了delta-T和传感器准确度的重要性。
无论采用何种冷却方法,以可靠的方式控制暖通空调流程和室内条件都至关重要。为实现这一目标,数据中心管理人员需要有精确的连续测量作为参考,因为良好的控制回路与测量的质量息息相关。因此,高质量传感器是有效控制暖通空调流程和稳定室内环境的推动因素。但是,安装时的传感器规格并不一定能作为长期性能可靠性的指标。传感器的价值体现在整个生命周期中,因为频繁的维护需求需要高昂的成本来满足。此外,正如蒙特的模型所显示的那样,即使是小幅的准确度偏差也会导致能源成本飙升。
在多数情况下,IT基础设施中数据的价值非常高,而且所涉及的通常是关键任务。因此,如果低成本传感器会导致高昂的维护成本或导致高价值数据面临风险,配置它就毫无意义了。用户应寻找耐用的、能够长期提供可靠、稳定读数的测量产品,因为重要的是产品的终身可靠性。
维萨拉产品经理Anu Kätkä
六、影响选择传感器的因素
1.可靠性
传感器在安装点的准确度显然很重要,但更重要的是传感器能长期稳定提供精确的读数。考虑到数据中心的较高价值以及通常较为偏远的位置,变送器的使用寿命应远高于正常水平。因此,制造商应具备该领域的经验,并具有在关键环境中进行可靠测量的声誉。可追溯的校准证书可确保传感器在出厂前正常运行,而经验证的可靠性意味着可以长期保持这种准确度水平。
2.维护成本
应避免使用维护要求高的传感器。不仅因为成本,还因为此类传感器会带来更高的故障风险。此外,如上所述,传感器漂移或准确度下降会导致巨额能源成本。数据中心对正常运行时间有较高水平的要求,这意味着监控设备的维护操作不应干扰数据中心的运行。因此,像维萨拉提供的带有可更换测量探头或模块的仪表能更好地满足客户需求——尤其是此类仪表可以移除传感器并离线校准。如果更换了测量探头或模块,则还应更新校准证书,这一点也很重要。理想情况下,应该能够使用仪表供应商提供的工具在现场进行维护操作,并且这项工作应作为定期保养计划的一部分进行。
3.可持续性
从传感器的角度来看,新技术允许用户只升级传感器的测量部件,而不必更换或报废整个变送器,这有助于避免不必要的浪费。在决定购买时,应考虑供应商的环境和可持续性证书。这能够让可持续发展沿供应链向下延伸,并为企业形成驱动力。可持续发展是蒙特和维萨拉的核心。以蒙特为例,他们在全球安装了超过1.5吉瓦的数据中心冷却设备,其节省的能源相当于瑞典每年能源消耗的2%。维萨拉在《金融时报》的“2022年欧洲气候领袖企业”名单中位列前五。这一榜单包含了在2015年至2020年期间温室气体减排量最多的欧洲公司。
七、总结
由于价值数十亿美元的关键数据在数据中心进行处理和存储,因此高耗电服务器必须保持在理想的温度和湿度条件下,以防止停机。同时,随着当下能源成本不断攀升,我们还迫切需要降低温室气体排放、提高能源效率、降低能源成本并采取更好的PUE衡量标准。这种“完美风暴”驱动因素意味着准确控制和优化暖通空调流程必不可少。