目前的AI芯片功率往往超过600瓦,因此浸没式冷却有望成为最佳降温方案。
英特尔本周公布了一项耗资7亿美元的可持续发展计划,希望为数据中心探索创新型液冷与浸没式冷却技术。
根据项目规划,英特尔将在自家位于波特兰以西约20英里处的希尔斯伯勒园区建造一处占地20万平方英尺的“大型实验室”,并在这里验证、测试和展示各种专门面向数据中心级高功率芯片的冷却技术。
除了这处实验室,x86巨头还公布了其芯片浸没式冷却系统的开放参考设计。设计方案由英特尔台湾分部开发,芯片巨头希望借此机会吸引更多台湾芯片制造商的加入,最终把成果推广到全球市场。
顾名思义,浸没式冷却是指导将芯片全部浸没至非导电流体(常见流体多为矿物油和某些专用制冷剂)以实现“降温浴”,因此替代较为传统的散热器或散热板。英特尔宣称,在对本已成熟的液冷技术做出进一步创新之后,有望将数据中心的碳排放量降低达45%。
Dell’Oro Group分析师Lucas Beran认为,这代表着数据中心在可持续发展道路上迈出的重要一步。
他解释道,虽然单个组件和服务器也在消耗大量电力,但数据中心总体能耗中超过40%其实是由冷却系统带来的。“最简单的能耗降低方法就是液冷,而浸没式冷却又是液冷中的重要组成部分。”
除了控制能源消耗之外,浸没式冷却还能带来其他附加优势。首先就是用水量的大幅减少,另外液冷的降温效果远优于风冷,而且排出的热液还可用于区域供暖等其他用途。
例如,Bytesnet最近就宣布计划回收其数据中心产生的热量,借此为荷兰格罗宁根地区的数千户家庭供暖。
英特尔最近之所以在数据中心可持续发展方面痛下苦功,原因就是即将推出的CPU、GPU和AI加速器呈现出功耗疯涨的整体趋势。
过去几年以来,大部分此类芯片的热设计功率(TDP)增加了一倍以上。如今,现代CPU架构正迈向300瓦大关,而英特尔、AMD和英伟达打造的GPU与AI芯片则已经来到600瓦上下。
Beran解释道,随着这些系统的全面出货并入驻主流数据中心,液冷、特别是浸没式冷却必将最终普及。这不止是为了提高系统散热效率,同时也是要抵消由此带来的恐怖冷却能耗。
他还强调,数据中心采用浸没式冷却的核心驱动力并不是为了快速降温,而是希望把从低效风冷中节约出来的大部分功率用于进一步增加计算密度。因此,Beran预计大部分数据中心运营商都会在不久的将来采用浸没式冷却方案。
在他看来,“如果从传统机架风冷系统过渡到浸没式冷却系统,消耗的电量会更低。但大多数运营商的想法并不是「我们的算力已经足够,现在只需要提高冷却效率。」”相反,大部分运营商永远都觉得自己所能提供的算力还差得远。
虽然浸没式冷却并不是什么新鲜事物,但Beran认为英特尔推动的这一开放参考设计仍然值得关注。
Beran认为,“英特尔在开发浸没式冷却兼容技术方面发挥着非常重要的作用。凭借着在戴尔、HPE等服务器OEM厂商中的强大影响力,英特尔确实有望改变他们对于产品销售和配套冷却设施的设计思路,进而彻底改变市场观念。”
Beran还提到,“现在英特尔正在设计从起步阶段就充分考虑到液冷,特别是浸没式冷却技术的基础设施产品。”
这种设计思路上的差异非常重要,因为液冷和浸没式冷却所对应的设备外形,与当前风冷数据中心设施将完全不同。而这种不同正是浸没式冷却在普及道路上面临的最大障碍之一。
未知确实会带来恐惧,不少数据中心运营商甚至不知道要如何处理液冷和浸没式冷却硬件中可能出现的各种问题。Beran还提到,这类技术还会改变设备的重量分布,这也是以往风冷系统不大需要考虑的因素。
对于英特尔计划建设的实验室,Beran总结道“这样的大型设施就像是游乐场,我们可以亲身前往、见证新型基础设施的运作方式。建成之后,运营商能够直接体验液冷方案,了解这些系统如何在数据中心环境下稳定运行。这将给整个行业创造出巨大的价值。”
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。