计算机图形芯片制造商Nvidia正在为新型超级计算机铺平道路,宣布其人工智能和高性能计算基础设施将很快支持基于Arm的CPU。
Nvidia今天早些时候表示,自己的CUDA-X AI和HPC库、GPU加速AI框架和软件开发工具将在今年年底前支持基于Arm的设备。这是重要一步,因为基于Arm的超级计算机由于具有更高功效而能够支持更大的规模。
Nvidia首席执行官黄仁勋表示:“随着传统计算扩展的结束,电力将成为限制所有超级计算机的一个因素。Nvidia的CUDA加速计算和Arm高能效CPU架构相结合,将为高性能计算领域提供一个提升突破百亿亿级性能的机会。”
Nvidia加速计算总经理兼副总裁在新闻发布会上表示,之所以决定支持基于Arm的CPU是因为他们对这个领域有着广泛而越来越浓厚的兴趣。”
“Arm吸引人之处在于它是非常开放的,它提供的灵活性可以连接CPU和GPU,实现更高能效的计算。”
由于Nvidia的寄出设施支持x86和基于POWER的计算机芯片,因此全球25个最节能的超级计算机中已经有22个采用了Nvidia的基础设施。Nvidia希望凭借对Arm芯片的支持提升自己的高性能计算领域的地位,支持更高级的人工智能工作负载。
Nvidia还希望将超级计算能力扩展到特定用途,例如为自动驾驶汽车训练AI系统。
为此,Nvidia在今天推出了所谓号称全球第22快的超级计算机——DGX SuperPOD,以及一个参考架构,面向那些希望将这个超级计算机部署在他们自己数据中心内部或者外部的企业。
Nvidia表示,DGX SuperPOD旨在提供部署大量自动驾驶车辆所需的AI训练基础设施。该系统可以三周之内部署完成,由96个Nvidia旧款DGX-2H超级计算机组成,这些超级计算机采用新的数据中心互连技术(今年早些时候收购Mellanox获得的技术)进行集成。
Nvidia表示,DGX SuperPOD旨在为自动驾驶汽车训练神经网络,使车辆可以了解“道路规则”,并提供每秒9.4 petaflops的性能,这个数字令人惊讶——以至于可以把对主流图像分类ResNet-50 AI算法的训练时间从25天缩短到不到2分钟。
Nvidia人工智能基础设施副总裁Clement Farabet在声明中表示:“要在人工智能领域占据领先地位,就需要在计算基础设施领域占据领先地位。很少有人工智能方面的挑战像训练自动驾驶汽车这样苛刻,需要对神经网络进行数万次的反复训练,以满足极高精确度的要求。”
好文章,需要你的鼓励
近期数据显示,2026年5月前企业已宣布约9万个与AI相关的裁员岗位,部分预测称未来五年美国15%的工作将被AI取代。然而,Ramp与Revelio Labs追踪近2.2万家企业的最新报告显示:重度投入AI的企业反而实现了更快的人员增长,包括初级岗位在内的各职能人数均有上升。但这一数据主要来自技术型企业,能否普遍适用仍存疑。报告同时指出,资源匮乏的企业可能在AI浪潮中持续落后。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。
AI数据中心开发商向多家电力公司同时提交大负荷接入申请以确定选址,导致区域需求预测虚高、电网投资失衡。美国联邦能源监管委员会(FERC)及ERCOT、PJM、SPP等机构正推动"承诺优先"规划机制,要求项目具备实质性商业承诺方可纳入长期传输规划。谷歌、亚马逊、微软、OpenAI等科技巨头支持建立标准化的项目成熟度评估体系,但各方在具体机制上仍存分歧。发电建设问题尚未被纳入联邦传输改革议程。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。