两相液体冷却如何解决热管理危机

随着AI工作负载产生的热量超出传统风冷系统处理能力,数据中心面临严峻的散热挑战。机架密度超过70KW使传统冷却方式无法胜任。两相液冷技术利用相变物理原理管理极端热负荷,相比传统水冷系统具有显著优势。尽管面临集成复杂性和供应链限制,但随着DarkNX等公司的大规模部署,该技术正从概念验证转向生产应用,为数据中心热管理带来革命性变化。

数据中心正面临着日益严重的散热危机,因为AI工作负载产生的热量水平已经超出了传统空气冷却系统的处理能力。机架密度现在已超过70千瓦——这在几年前是难以想象的——这一日益严峻的挑战推动了热管理策略的根本性转变。

两相液体冷却曾经仅限于专门的高性能计算环境,现在正步入主流数据中心运营。这种先进的冷却方法使用相变物理原理来管理传统水基系统无法处理的极端热负荷。然而,尽管前景看好,但集成复杂性、供应链限制以及运营商缺乏熟悉度都减缓了广泛采用的步伐。

但最近的发展表明潮流正在转向。例如,DarkNX计划在其位于安大略省的300兆瓦AI数据中心园区部署Accelsius的NeuCool技术。同时,OptiCool Technologies与Intelisys合作,扩大其两相后门热交换器系统的渠道接入。这些举措标志着从实验性概念验证试验向全规模生产部署的转变。

"为什么会有人认为在未来5到10年内拥有最高热流密度的数据中心不会采用两相技术?"Accelsius首席执行官Josh Claman在接受Data Center Knowledge采访时表示。"所有其他工业领域都已转向两相技术。"

两相液体冷却的物理优势

两相液体冷却通过使用相变物理原理而非依赖机械力提供了显著优势。当介电流体与热源接触时,它会从液体转变为蒸汽,在相变过程中吸收热能。这种机制使两相系统能够处理会压倒单相水基冷却系统的热负荷。

"水基系统依靠增加流量或管道容量来传导额外热量,这会产生自然限制,"OptiCool Technologies销售副总裁Matt Roberts解释道。"两相系统不会面临这些限制,因为制冷剂从液体到蒸汽的相变为你完成了工作。"

Claman描述了在4500瓦特下进行的测试,每个插座具有极高的热流密度。"我们测试的限制实际上是我们的实验室设备,而不是我们的技术,"他说。此外,两相系统的运行流量仅为水基系统所需流量的五分之一到九分之一,减少了泵的负载和系统复杂性。

另一个关键优势是改善的安全性能。与水不同,介电流体不导电,这意味着泄漏不会对服务器造成损坏风险。"如果我们发生泄漏,我们只是泄漏一点蒸汽,"Claman指出。"对人类是安全的。你甚至可以用这种服务器流体洗澡。"

集成权衡

部署两相冷却系统需要在性能提升和实施复杂性之间取得平衡。

改装和基础设施升级的挑战

两相系统可以改装到现有数据中心,但这个过程绝非简单。Carbonexit Consulting的清洁技术顾问Francois Le Scornet解释说,在机架层面进行改装涉及使用连接到二级冷凝器回路的蒸发冷板或浸没槽。这些安装需要额外的基础设施,包括新的歧管、冷却剂密封系统和监控机制,以管理相变行为。

"这绝对不是完全简单的过程,"Le Scornet说。直接到芯片的单相系统仍然更常见,而两相浸没系统则面临材料和操作挑战。

模块化系统简化部署

OptiCool Technologies通过在其系统设计中强调模块化来解决这些集成障碍。该架构包含三个主要组件:泵、顶置歧管和直接安装在机架上的后门热交换器。Roberts将这些比作"乐高积木",运营商可以根据特定场地要求进行配置。

"部件是标准化的,但布局完全灵活,给运营商自由设计围绕他们空间的系统,而不是重新设计他们的空间来适应系统,"Roberts说。热交换器与任何制造商的机架集成,无需更换现有基础设施。

与现有冷却系统的兼容性

对于配备冷冻水设备的设施,OptiCool系统可以直接连接。在没有冷冻水的情况下,公司提供基于DX的室外机组,创建闭环系统。

Accelsius采用类似的集成方法。"如果数据中心为液体冷却做好了准备,我们就是即插即用,"Claman说。这些系统可以与使用相同设施水回路的单相水冷机架并行运行,但效率更高。对于专门为两相冷却设计的新建项目,运营商可以减少冷水机组要求,因为系统能够在更温暖的设施水上运行。

两相冷却的投资回报率计算

在评估两相冷却投资时,运营商通常依赖功率使用效率(PUE)及其局部变体部分PUE(pPUE)等指标。传统空气冷却数据中心通常实现1.3到1.6的PUE值,这取决于气候和设施设计等因素。相比之下,两相冷却区域可以实现低至1.05到1.10的pPUE值,这得益于减少的风扇负载和对机械冷却系统依赖的最小化。

"当需要高密度机架时,ROI变得很有吸引力,因为液体系统允许每平方米更多的计算并减少对冷水机组的依赖,"Le Scornet说。

Roberts概述了OptiCool的对比分析。与CRAC(计算机房空调)和CRAH(计算机房空气处理)单元相比,两相冷却提供了更低的功耗并需要更少的维护。"年度运营成本的降低与传统气流管理相比可节省高达90%,"他说。

Claman强调了规模化可以实现的效率提升。"如果我获得了100兆瓦或千兆瓦的特定功率包络,我可以将更多功率用于计算,"他说。"如果你有一个100兆瓦的数据中心并浪费了10兆瓦,也许这不是大问题。但如果你达到500兆瓦或千兆瓦,你可能节省了相当于辛辛那提的功率。"

从概念验证到生产

两相冷却系统从测试到全规模部署的转变正在获得动力。据Claman称,Accelsius当前管道的四分之三现在包含生产机会而不是概念验证场景。"一年前,几乎所有这些都是概念验证机会,"他说。"现在大多数是,'嘿,我们对这项技术感到舒适,我们将建造一个新的数据中心。'"

这种转变反映了对两相冷却技术信心的增长。Accelsius战略性地专注于传统保守数据中心部门之外的早期采用者——愿意基于其优点评估技术的公司。"我们寻找真正了解信息、查看数据、研究解决方案并进行客观比较的早期采用者,"Claman说。

值得注意的是,历史上因担心潜在故障而避免水基冷却系统的行业正在涌现兴趣。"我们从那些'恐水'的行业得到了很多关注,"Claman说,包括"金融科技、高频交易、银行业和真的不能容忍其数据中心发生灾难性故障的航空公司。"

Q&A

Q1:两相液体冷却技术相比传统空气冷却有什么优势?

A:两相液体冷却使用相变物理原理,当介电流体接触热源时从液体转变为蒸汽,在相变过程中吸收热能。这使其能够处理传统空气冷却和水基系统无法应对的极端热负荷,流量仅为水基系统的五分之一到九分之一,并且介电流体不导电,泄漏时不会损坏服务器。

Q2:数据中心部署两相冷却系统需要面对哪些挑战?

A:主要挑战包括改装复杂性、供应链限制和运营商缺乏熟悉度。改装现有数据中心需要额外基础设施如新歧管、冷却剂密封系统和监控机制。不过,通过模块化设计可以简化部署,系统可以与现有机架集成而无需更换基础设施。

Q3:两相冷却系统的投资回报率如何计算?

A:传统空气冷却数据中心PUE值通常在1.3-1.6之间,而两相冷却区域可实现1.05-1.10的pPUE值。OptiCool分析显示,与传统气流管理相比年度运营成本可节省高达90%。对于高密度应用,液体系统允许每平方米更多计算并减少对冷水机组的依赖。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2025

12/12

08:18

分享

点赞