数据中心是国家、社会和企业的数字化转型的基础设施和重要支撑。在全球及国内“双碳”战略的大背景之下,数据中心作为数字新基建的重要组成部分,不仅承担着支撑数字经济发展的重任,也是实现“双碳”目标的重要环节之一。由于成本上升和供电量方面的限制,能效在数据中心内变得越来越重要。提升能效的最佳方式就是,使用DPU(数据处理器)或智能网卡来卸载相关应用并加速网络,完善安全、存储或其他基础架构功能并控制平面应用,以实现降低服务器耗电量的目的。
全球数据中心耗电量不断增加
最近,受需求旺盛和供应链不稳定等因素影响,全球电价正在不断飙升。许多数据中心可获得的供电量有硬性指标限制,这就形成了一个强劲的激励因素,促使数据中心不断提高效率,以便容纳更多应用和租户,具备更高的生产力,无须再构建或租用一个新的数据中心。
同时,云服务提供商正在承受着持续的竞争压力。云服务提供商要不断降低“软件即服务”“平台即服务”和“基础设施即服务”的每小时租用成本,而且在许多地区还要承受不断上涨的电力成本。各种组织(服务提供商、企业和政府机构)都急需提高能效来应对气候变化,需要购买更昂贵的“绿色”电力来替代火力发电所产生的电力。因此,在节省资金、更大限度提升每个数据中心利用率,以及应对气候变化等压力之下,每个数据中心运营商都在力争提升服务器的能效。
根据测算,数据中心目前消耗的电量占全球发电量的比例略高于1%。这一占比在美国为1.8%,在欧洲为2.7%。根据华为在2015年发布的一项研究,到2030年,数据中心消耗的电量占全球发电量的比例预计将上升到8% (可能的估算值),甚至会高达13% (最差情况预测值)。
提升每台服务器效率和能效的策略
在上述背景下,数据中心运营商通常会采取多种策略来降低耗电量和电力成本。
一是在电力供应成本更低或供应量更丰富的地区建立新的数据中心,这种方式可以降低电力成本而非耗电量。
二是改善电源使用效率(PUE)。这意味着更大限度地提升数据中心用于实际计算设备电力所占的百分比。不过,该方法不能提升各个服务器的能效。
三是提高冷却效率。这是因为冷却所消耗的电量在数据中心用电量中所占的比例最高可达 30%,所以该方法可以降低冷却所需的电力,并降低PUE比率。
四是使用虚拟化、容器和可组合基础架构。这能够更大限度地提升每台服务器的工作负载利用率。
五是提升单台服务器的能效。
六是将选定的IT工作负载外包给公有云,或外包给电力成本更低的主机托管中心。不过,并非所有工作负载都可以进行外包,公有云的高能效所带来的好处也并非始终都能惠及租户。
在过去的几年里,数据中心采取了前三种策略来降低耗电量并节省电力成本,这使得数据中心的PUE持续大幅下降。但是目前,数据中心的平均PUE已经趋于平稳。为进一步降低数据中心耗电量和电力成本,就需要采用第四种和第五种策略来更大限度地提升每台服务器的效率和能效,而DPU是实现这些策略目标的有效途径。
DPU应用能够提高数据中心效率
使用DPU(数据处理器)或智能网卡来卸载相关应用并加速网络,完善安全、存储或其他基础架构功能并控制平面应用,能够将服务器的耗电量降低30%。在服务器生命周期内(3年),拥有1万台服务器的大型数据中心可以轻松节省500万美元的电力成本,同时还可进一步节省冷却、配电、机架空间和服务器的资本成本。
例如近期,NVIDIA将通过Open vSwitch (OVS)网络卸载,来帮助北美地区一家知名的无线运营商实现节能降耗。OVS是一款用于软件定义网络(SDN)的通用开源工具。通常,OVS作为操作系统内核软件运行在服务器的x86 CPU上,但现在它可以被卸载到BlueField DPU的网络加速器上。在空载(0%)至满载(100%)的不同情况下,NVIDIA在测试中将工作负载进行了对比,观察内核(CPU)中OVS的运行情况,以及将OVS卸载到DPU上的耗电量变化。
当工作负载为满载时,DPU卸载最多可降低29% (127瓦)的耗电量。这是因为BlueField DPU在处理OVS SDN任务时,比x86 CPU的速度更快,并且更加节能高效。
将网络任务卸载到BlueField DPU时,每台服务器的耗电量能够降低至34%(247瓦)。服务器利用率越高,基于硬件的网络卸载所节省的能耗就越多。节能的价值取决于当地的电力成本和PUE比率。如果DPU卸载和加速能够减少相同工作负载所需的服务器数量,数据中心就可以节省更多的资本性支出和能耗。
展望未来,DPU应用是提高数据中心效率的有效途径。DPU网络卸载能够大幅减少每台服务器的耗电量,使得服务器效率、数据中心效率得到提升。DPU卸载还可以降低用电量、减少冷却负载,最终实现成本的大幅降低。在当前能源成本不断上涨、绿色环保IT基础设施需求不断增加的阶段,采用DPU无疑是大势所趋。通过DPU,人们能够降低数据中心的资本性支出和运营性支出,最终实现TCO(总体拥有成本)的下降。