提高数据中心能效的方法有很多,例如浸没式冷却等等,但这些方法的实施成本高而且复杂。
要降低数据中心能源成本,一个更简单有效的方法是提高气流的效率。空气在数据中心内的设备上的流动越容易,传统的HVAC(英文Heating, ventilation, and air conditioning(暖通空调)的缩写)系统就越能够有效地保持设备的冷却。
考虑到这一点,下面我们来看看数据中心空气流五个实用的优化步骤。
我们从可能的最明显改善气流的方法着手:封堵泄漏。泄漏会改变冷空气的流动方向,冷空气流动方向就会与所希望的方向不同。例如,如果本来想给一个服务器机柜降温,机柜外部的孔或缝隙就可能会降低基于空气的冷却系统的效率。
有可能无法堵住所有缝隙或孔洞:有些缝隙或孔洞是不可避免的,因为有一些要求导致了这些缝隙或孔洞的存在,例如电缆必须接入某个设备。但在可能的范围内,务必找到并堵好泄漏点以提高气流效率。
另外一个简单但关键的改善气流的方法:确保冷却系统的目标是那些希望被冷却的设备。不要用冷空气去填充整个数据中心,也不要只是让冷空气大致吹向服务器和其他产热设备那个方向,而是要将冷空气源尽可能直接对准希望被冷却的设备。
这一策略的实施可能需要更多的管道工程,而且还可能要安装额外的HVAC设备才能将冷空气输送到更远的目标地点。但前期的成本如果能转化为更好的能源效率就非常值了。
即使你的数据中心内已经有效地将冷空气送到了目标设备,更大容量的风扇或鼓风机可以增加清凉空气的移动,进而提高气流的效率。
当然,运行更大容量的风扇需要更多的电力。但是,旋转风扇所需的电力要比冷却空气所需的电力小得多。即是说,如果更强大的风扇可以在数据中心内更有效地分送冷空气,那就能够实现更高的整体能源效率。
这里需要注意的是,如果冷空气已经被有效地得到分送了,或者如果吹的是室温空气而不是清凉空气(在这种情况下,风扇的电力成本可能会超过更有效地分送空气所节省的效率),那么更大容量的风扇就没有什么帮助了。另外,不要认为提高风扇速度是解决气流效率低下情况的廉价办法,解决气流效率低的根本原因肯定是一个比购买更大风扇更好的办法。认识到这一点同样重要。但是,更大容量的风扇再加上与其他优化冷空气使用的措施相结合时,更高的风扇速度就可以提供一个推动力,帮助确保空气在数据中心内以最有效的方式流动。
服务器机柜的后面通常是产生热量最多的地方。如果一个服务器机柜的后面对着另一个机柜的前面就很难以有效的方式冷却这些服务器。如果服务器机柜以后面对前面的方式放置的话,最终冷空气吹到服务器之间的过道上时,过道的一边比另一边更热(因为过道的一边是机柜的后面),就会导致整体气流效率的降低。
所谓的热通道/冷通道配置是一个更佳的方法。热通道/冷通道配置方法指的是,数据中心运营商一排一排地放置服务器机柜,一排机柜的前面对着另一排机柜的前面,同样,机柜的后面对着机柜的后面。
机柜这么放置时,大量的冷空气就可以对准两边都有服务器机柜后面的过道,这样使用冷空气可以达到最大效果。而那些机柜前面对前面的过道可以分送少一些的冷空气,因为需要散的热量较少一些。
为了在数据中心实现最大可能的气流效率,务必确保空气不要流向不应该去的地方。
这意味着,首先要在服务器机柜的上方安装屏障,确保所有的空气流过服务器,而不是流向服务器上方的空隙。数据中心的任何其他部分也应该封闭起来,例如储物空间或暂存空间,这些地方放置的不是IT设备,因此宝贵的空气不要浪费在这些地方。
换句话说,目标应该是在需要冷却的设备周围建一个盒子,空气流只限于流向这个盒子。
几乎所有的数据中心都至少部分地依靠空气流动防止IT设备过热。但有些数据中心在这方面比别的数据中心更有效。为了最大限度地利用气流,务必要确保根除那些可能导致空气流向不需要的地方而出现低效率,同时要采取措施将空气引向最能发挥作用的地方。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。