美国橡树岭国家实验室(Oak Ridge National Laboratory)的Frontier超级计算机在全球最快超级计算机Top500榜单中名列前茅。

今天发布的最新版Top500榜单中,Frontier成为全球速度最快的超级计算机,性能为每秒1.102 exaflops(exaflop等于每秒100万万亿次计算操作)。Frontier的性能是使用HPL这一主流的基准测试进行衡量的。
此前Top500榜单的头把交椅是位于日本神户的Fugaku超级计算机,Fugaku在HPL基准测试中实现了442 petaflops的性能,理论最高速度据称超过了1 exaflop。
美国能源部在2019年5月公布了一项科技计划,其中就包括了Frontier超级计算机。美国能源部将Frontier超级计算机的开发任务委托给了AMD和超级计算机制造商Cray。
就在该计划公布的几天之后,HPE宣布签署协议以13亿美元的价格收购了Cray,这次收购也让HPE成为超级计算市场中最大的厂商之一。此后,HPE将Cray的产品纳入了自己的超级计算产品组合中。
Frontier系统中包含了74个HPE Cray EX机柜,每个机柜可容纳128个刀片(一种紧凑型服务器)。刀片通常比标准数据中心服务器的组件更少,更易于冷却,与硬件维护相关的某些任务也更为简单。
Frontier系统中的每个刀片都采用了1个AMD的Epyc处理器CPU和4个Instinct MI250x加速器。MI250x加速器是AMD销售的计算模块,具有2个6纳米GPU,每个GPU都配置了大量HBM2E内存,这是一种高速内存,用于存储芯片正在处理的数据,以实现快速访问。
总的来看,Frontier包含了大约9408个CPU和37632个GPU,通过专门的冷却系统对芯片进行散热,这种冷却系统每分钟流经Frontier约5900加仑的水。
相比空气来说,水的导热性更好,因此水冷系统通常比风扇更有效。HPE表示,Frontier系统不仅是全球最快的超级计算机,而且是最节能的。Frontier提供每瓦52.23 gigaflop的性能,1 gigaflop相当于每秒10亿次计算操作。
Frontier系统的芯片、机柜和其他组件通过长约90英里的电缆连接在一起,CPU和GPU由一种名为Orion的高速存储系统提供支持,该系统提供700 PB的容量,每秒可以将超过35 TB的数据写入存储,并且每秒执行超过150亿次随机IPOS。
HPE公司执行副总裁、高性能计算和人工智能部门总经理Justin Hotard表示:“今天公布的Frontier exascale级超级计算机在速度和性能方面取得了突破,让我们有机会解答那些以前甚至都不知道要问的问题。Frontier系统一套一流的系统,是技术专家、科学家和研究人员设想的、旨在释放全新能力、同时提供开放科学、人工智能和其他突破并造福人类的系统。”
据HPE称,Frontier系统帮助研究人员开发出的神经网络,其规模是此前使用早期硬件搭建的神经网络的8倍,而且人工智能训练速度将提高4.5倍。
美国橡树岭国家实验室的计算和计算科学实验室副主任Jeff Nichols说:“来自世界各地的科学家和工程师将利用该系统非凡的计算速度,来解决我们这个时代最具挑战性的一些问题。”
HPE和AMD目前正在为美国能源部开发另一套名为El Capitan的百亿亿级超级计算机,该系统预计速度比Frontier更快。到2023年推出时,El Capitan的性能将超过2 exaflops。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。