Perlmutter将帮助科学家推动暗能量等前沿课题的研究
英伟达公司本周四公布了号称全球最强的AI超级计算机。这是一台名为Perlmutter的庞然大物,专供美国国家能源研究科学计算中心(NERSC)使用。

英伟达公司CEO黄仁勋介绍称,“Perlmutter将AI与高性能算力融合起来,有望推动材料科学、量子物理学、气候预测、生物研究等众多领域实现突破。”
这项耗资1.46亿美元的超级工程将分两个阶段推进,但目前的成果已经具备了一定可用性。
第一阶段主要由HPE工程师们组装基础设施以容纳设备,并部署总计1536个计算节点,每个节点包含4个由NVLink-3连接的英伟达A100 Tensor Core GPU外加1块AMD Milan Epyc处理器。据了解,这台超级计算机共包含6159个英伟达最新A100 GPU与1536块AMD服务器芯片,可在FP16精度下实现四百亿亿次AI计算性能。
第二阶段将于今年晚些时候启动,计划为设备添加更多CPU核心。新增的3072个计算节点将各包含2块AMD Milan处理器,且每节点封装512 GB内存。英伟达全球高性能计算与人工智能产品营销负责人Dion Harris在采访中表示,Perlmutter完成之后有望一举冲进全球超算五百强榜单的前五位置。之所以无法直接登顶,是因为超算五百强榜单要求以FP64精度为基础比较算力水平。
Perlmutter将在劳伦斯伯克利国家实验室部署并发挥作用。事实上,Perlmutter这个名字就来自该实验室兼加州大学伯克利分校物理学家Saul Perlmutter,他对宇宙膨胀速度超过原有预期的证明为他赢得了2011年诺贝尔奖。
这台超级计算机的一大核心诉求,在于构建起迄今为止规模最大的宇宙3D模拟星图。研究人员将把由暗能源光谱仪(安装在基特峰国家天文台直径四米的尼克拉斯·梅耶尔望远镜上,可捕获约3000万个星系发出的光)捕捉到的图像集中起来,供Perlmutter高效处理。
宇宙学家可以使用望远镜图像计算出不同星体之间的距离,由此判断暗能量对于宇宙膨胀的影响。与哈勃常数相关的膨胀率一直是个备受争议的话题,各方科学家对其具体数值始终莫衷一是。
Perlmutter将集中处理暗能量光谱仪捕捉的图像,并帮助研究人员确定望远镜接下来值得关注的新区域。该传感器每晚可收集多达15万个数据点,手动检查各星系光谱显然没有现实可行性,必须借助超级计算机之力实现自动化。劳伦斯伯克利国家实验室的科学家们希望在Perlmutter的帮助下,将数据的处理周期由以往的几周甚至几个月缩短为几天。
NERSC数据架构师Rollin Thomas致力于推进团队对于系统软件的应用,他认为GPU能够显著加速数字计算流程。他强调,“在准备工作中,我们使用GPU实现了20倍加速效果,我个人对此非常满意。”
这台超级计算机还支持OpenMP与英伟达HPC SDK——这是一套编译器与软件库,能够在GPU上对使用C++及Fortran编写的科学计算进行加速。Rapids则是英伟达在该计算机上配套使用的另一套框架,用于支持Python编写的数据科学应用程序。
劳伦斯伯克利国家实验室一位发言人在采访中表示,“Perlmutter系统将在推动美国科学研究方面发挥关键作用,并在包括先进计算、人工智能与数据科学在内的诸多关键技术领域保持领先及核心地位。”
“这套系统还将被广泛应用于气候与环境、清洁能源技术、半导体与微电子学、以及量子信息科学的研究。”
Perlmutter将成为NERSC的旗舰超级计算机,取代2016年安装部署的Cori系统(性能为30千万亿次)。Cori将被逐步拆解并最终彻底淘汰。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。