美国橡树岭国家实验室(Oak Ridge National Laboratory)的Frontier超级计算机在全球最快超级计算机Top500榜单中名列前茅。
今天发布的最新版Top500榜单中,Frontier成为全球速度最快的超级计算机,性能为每秒1.102 exaflops(exaflop等于每秒100万万亿次计算操作)。Frontier的性能是使用HPL这一主流的基准测试进行衡量的。
此前Top500榜单的头把交椅是位于日本神户的Fugaku超级计算机,Fugaku在HPL基准测试中实现了442 petaflops的性能,理论最高速度据称超过了1 exaflop。
美国能源部在2019年5月公布了一项科技计划,其中就包括了Frontier超级计算机。美国能源部将Frontier超级计算机的开发任务委托给了AMD和超级计算机制造商Cray。
就在该计划公布的几天之后,HPE宣布签署协议以13亿美元的价格收购了Cray,这次收购也让HPE成为超级计算市场中最大的厂商之一。此后,HPE将Cray的产品纳入了自己的超级计算产品组合中。
Frontier系统中包含了74个HPE Cray EX机柜,每个机柜可容纳128个刀片(一种紧凑型服务器)。刀片通常比标准数据中心服务器的组件更少,更易于冷却,与硬件维护相关的某些任务也更为简单。
Frontier系统中的每个刀片都采用了1个AMD的Epyc处理器CPU和4个Instinct MI250x加速器。MI250x加速器是AMD销售的计算模块,具有2个6纳米GPU,每个GPU都配置了大量HBM2E内存,这是一种高速内存,用于存储芯片正在处理的数据,以实现快速访问。
总的来看,Frontier包含了大约9408个CPU和37632个GPU,通过专门的冷却系统对芯片进行散热,这种冷却系统每分钟流经Frontier约5900加仑的水。
相比空气来说,水的导热性更好,因此水冷系统通常比风扇更有效。HPE表示,Frontier系统不仅是全球最快的超级计算机,而且是最节能的。Frontier提供每瓦52.23 gigaflop的性能,1 gigaflop相当于每秒10亿次计算操作。
Frontier系统的芯片、机柜和其他组件通过长约90英里的电缆连接在一起,CPU和GPU由一种名为Orion的高速存储系统提供支持,该系统提供700 PB的容量,每秒可以将超过35 TB的数据写入存储,并且每秒执行超过150亿次随机IPOS。
HPE公司执行副总裁、高性能计算和人工智能部门总经理Justin Hotard表示:“今天公布的Frontier exascale级超级计算机在速度和性能方面取得了突破,让我们有机会解答那些以前甚至都不知道要问的问题。Frontier系统一套一流的系统,是技术专家、科学家和研究人员设想的、旨在释放全新能力、同时提供开放科学、人工智能和其他突破并造福人类的系统。”
据HPE称,Frontier系统帮助研究人员开发出的神经网络,其规模是此前使用早期硬件搭建的神经网络的8倍,而且人工智能训练速度将提高4.5倍。
美国橡树岭国家实验室的计算和计算科学实验室副主任Jeff Nichols说:“来自世界各地的科学家和工程师将利用该系统非凡的计算速度,来解决我们这个时代最具挑战性的一些问题。”
HPE和AMD目前正在为美国能源部开发另一套名为El Capitan的百亿亿级超级计算机,该系统预计速度比Frontier更快。到2023年推出时,El Capitan的性能将超过2 exaflops。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。