冷却数据中心的最简单方法就是安装空气交换器,产生冷空气并在服务器机房内进行循环。但如果您想省钱,至少从长远来看,更好的方法可能是在每个机架上安装空气交换器,并用这些交换器来冷却各个服务器机架。
后一种方法被称为“后机架冷却”,与数据中心中更传统的空气冷却系统相比,具有多种优势,特别是在能源效率方面。
以下让我们来看看后机架冷却的工作原理,以及为什么你可能希望在数据中心内考虑将后机架冷却作为改进冷却方法的一种方式。
什么是数据中心后机架冷却?
数据中心的后机架冷却,需要使用直接安装在服务器机架后面的空气交换器来冷却机架中的服务器。
在后机架冷却系统中,每个服务器机架都配备了空气交换器。当机架运行的时候,空气交换器吹入冷空气并排出热空气。
后机架冷却与CRAC以及直接芯片冷却法
后机架冷却不同于传统的数据中心空气冷却系统(称为“计算机房空调”或“CRAC”),因为后机架冷却器不是将冷空气吹过整个服务器机房,而是针对产生最多热量的设备。
从概念上讲,后机架冷却有些类似于直接芯片冷却系统,后者使液体在服务器内的CPU或者其他热源周围循环。这是将散热集中在产生大部分热量设备上的另一种方法。
然而,直接芯片冷却系统因为需要特殊的冷却液和循环器,因此成本高昂。如果你想将冷却资源引导至热源,但没有直接芯片冷却的预算,那么后机架冷就是你的一个最佳选择。
后机架冷却的好处
后机架冷却的主要好处是可以更高效地利用冷空气。在CRAC系统中,吹入服务器机房的大部分空气都被浪费了,因为没有与实际产生热量的设备进行接触。相比之下,后机架冷却系统以更本地化的方式针对服务器,从而减少浪费。
后机架冷却还可以提高数据中心能源效率,进而提高PUE指标,因为当单个机架内的服务器未满负荷使用或不活动的时候,就可以关小或者关闭空气交换器。
CRAC系统通常不提供这个选项。如果你有任何服务器正在运行中,那么整个CRAC系统可能都需要打开,即使有时产生的热量很少。
最后,后机架冷却是比液体冷却系统更便宜的一个冷却选项,至少从前期成本来看是这样。然而,从长远来看,液体冷却的成本较低,因为它需要的能源较少。
后机架冷却带来的挑战
虽然后机架冷却有很多优势,但在数据中心中实施的时候会有一些潜在障碍。后机架冷却带来的挑战包括:
什么时候应该选择后机架冷却?
如果你正在寻找一种提高数据中心能源效率的方法,但没有预算或时间来实施先进的冷却解决方案(例如直接芯片冷却或浸入式冷却),后机架冷却就是一个很好的折衷方案,它比冷却整个机房的传统空气系统更高效、更有效,而且比液体冷却更便宜且安装更简单一些。
另一方面,如果你关注至少未来几年的长期成果,液体冷却可能会比后机架冷却提供更好的投资回报率,因为直接到芯片冷却和浸入式系统的效率更高。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。