美国橡树岭国家实验室(Oak Ridge National Laboratory)的Frontier超级计算机在全球最快超级计算机Top500榜单中名列前茅。

今天发布的最新版Top500榜单中,Frontier成为全球速度最快的超级计算机,性能为每秒1.102 exaflops(exaflop等于每秒100万万亿次计算操作)。Frontier的性能是使用HPL这一主流的基准测试进行衡量的。
此前Top500榜单的头把交椅是位于日本神户的Fugaku超级计算机,Fugaku在HPL基准测试中实现了442 petaflops的性能,理论最高速度据称超过了1 exaflop。
美国能源部在2019年5月公布了一项科技计划,其中就包括了Frontier超级计算机。美国能源部将Frontier超级计算机的开发任务委托给了AMD和超级计算机制造商Cray。
就在该计划公布的几天之后,HPE宣布签署协议以13亿美元的价格收购了Cray,这次收购也让HPE成为超级计算市场中最大的厂商之一。此后,HPE将Cray的产品纳入了自己的超级计算产品组合中。
Frontier系统中包含了74个HPE Cray EX机柜,每个机柜可容纳128个刀片(一种紧凑型服务器)。刀片通常比标准数据中心服务器的组件更少,更易于冷却,与硬件维护相关的某些任务也更为简单。
Frontier系统中的每个刀片都采用了1个AMD的Epyc处理器CPU和4个Instinct MI250x加速器。MI250x加速器是AMD销售的计算模块,具有2个6纳米GPU,每个GPU都配置了大量HBM2E内存,这是一种高速内存,用于存储芯片正在处理的数据,以实现快速访问。
总的来看,Frontier包含了大约9408个CPU和37632个GPU,通过专门的冷却系统对芯片进行散热,这种冷却系统每分钟流经Frontier约5900加仑的水。
相比空气来说,水的导热性更好,因此水冷系统通常比风扇更有效。HPE表示,Frontier系统不仅是全球最快的超级计算机,而且是最节能的。Frontier提供每瓦52.23 gigaflop的性能,1 gigaflop相当于每秒10亿次计算操作。
Frontier系统的芯片、机柜和其他组件通过长约90英里的电缆连接在一起,CPU和GPU由一种名为Orion的高速存储系统提供支持,该系统提供700 PB的容量,每秒可以将超过35 TB的数据写入存储,并且每秒执行超过150亿次随机IPOS。
HPE公司执行副总裁、高性能计算和人工智能部门总经理Justin Hotard表示:“今天公布的Frontier exascale级超级计算机在速度和性能方面取得了突破,让我们有机会解答那些以前甚至都不知道要问的问题。Frontier系统一套一流的系统,是技术专家、科学家和研究人员设想的、旨在释放全新能力、同时提供开放科学、人工智能和其他突破并造福人类的系统。”
据HPE称,Frontier系统帮助研究人员开发出的神经网络,其规模是此前使用早期硬件搭建的神经网络的8倍,而且人工智能训练速度将提高4.5倍。
美国橡树岭国家实验室的计算和计算科学实验室副主任Jeff Nichols说:“来自世界各地的科学家和工程师将利用该系统非凡的计算速度,来解决我们这个时代最具挑战性的一些问题。”
HPE和AMD目前正在为美国能源部开发另一套名为El Capitan的百亿亿级超级计算机,该系统预计速度比Frontier更快。到2023年推出时,El Capitan的性能将超过2 exaflops。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。