Nvidia今天推出了两款用于高性能计算和人工智能工作负载的芯片新品。
本周Nvidia在德国汉堡举行的ISC高性能计算大会上宣布推出了这两款芯片——Nvidia Grace CPU Superchip和Nvidia Grace Hopper Superchip,旨在为新一代的百亿亿级计算机服务器提供动力。

Nvidia表示,Nvidia Grace CPU超级芯片基于是Nvidia首款基于Arm的CPU(代号也是Grace)。该芯片配置了两个基于Arm的CPU提供支持,并通过高带宽、低延迟的Nvidia NVLink-C2C进行连接。Nvidia称这是一个“突破性的设计”,其中包含了多达144个Arm Neoverse内核,采用了Scalable Vector Extension和性能达每秒1 TB的内存系统。
Nvidia Grace CPU Superchip与PCIe Gen5协议接口,可以轻松链接到Nvidia最新的GPU,用于人工智能和机器学习工作负载,也可以与Nvidia BlueField-3 DPU连接,用于高性能计算应用。
至于Nvidia Grace Hopper超级芯片,这是一个更强大的系统,结合了Nvidia Hopper GPU与Nvidia Grace CPU,是一个通过NVLink-C2C连接的集成模块,用于高性能计算和大规模人工智能工作负载。
Nvidia表示,这两个新系统都运行Nvidia的人工智能和高性能计算软件的完整产品组合,支持“全栈的、集成的计算”。
这两个系统主要针对OEM厂商,特别是计算机服务器制造商,而且这些客户会立即采用这些芯片,首批搭载Grace超级芯片的系统将于今年晚些时候推出,包括戴尔、HPE、联想、浪潮、技嘉、超微和Atos。Nvidia承诺,将会给这些OEM厂商带来更高性能、更大内存带宽、更高能效等诸多优势。
而且Nvidia正在试图让几家知名客户来为自己背书,其中包括美国国防部的洛斯阿拉莫斯国家实验室。
洛斯阿拉莫斯实验室公布了一套名为Venado的新型高性能计算系统,号称是使用HPE Cray EX超级计算机构建的“异构系统”,将混合使用Grace CPU超级芯片节点和Grace Hopper超级芯片。一旦系统开始运行,预计性能将超过10 exaflops,并得到广泛应用。
洛斯阿拉莫斯实验室模拟和计算副主任Irene Qualters表示:“Venado系统为LANL的研究人员带来了Nvidia Grace Hopper的高性能水平,将继续致力于推动科学突破的界限。Nvidia的加速计算平台和广阔的生态系统正在消除性能上的障碍,使该实验室能够有新的发现,造福国家和整个社会。”
Nvidia的另一个主要客户是瑞士国家计算中心,该中心表示,他们的新系统也将由HPE Cray EX超级计算机构建。该中心表示,这套计划中的系统将配置多个Grace CPU超级芯片,将作为一种面向通用研究的先进平台提供服务。
Nvidia公司超大规模和高性能计算副总裁Ian Buck表示,超级计算领域正在进入百亿亿次人工智能的新时代,这将让研究人员能够应对以前那些遥不可及的挑战。
他说:“在气候科学、能源研究、太空探索、数字生物学、量子计算等领域,Nvidia Grace CPU超级芯片和Grace Hopper超级芯片构成了世界上最先进的高性能计算和人工智能平台的基础。”
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。