源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微成为首批将基于NVIDIA Grace的HGX系统用于HPC和AI的制造商
NVIDIA于今日宣布,多家全球领先的计算机制造商正在采用全新NVIDIA Grace™超级芯片打造新一代服务器,为超大规模时代的AI和HPC工作负载提速。
源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微计划部署基于NVIDIA Grace CPU 超级芯片和NVIDIA Grace Hopper™超级芯片的服务器。
所有这些新系统都得益于刚刚发布的NVIDIA HGXTM平台中的Grace和Grace Hopper设计。制造商根据这些设计所提供的蓝图,能够构建出可以提供最高性能,并且内存带宽和能效两倍于当今领先的数据中心CPU的系统。
NVIDIA超大规模和HPC副总裁Ian Buck表示:“超级计算已进入到超大规模AI时代。NVIDIA正与OEM合作伙伴一道助力研究者攻克此前无法解决的巨大挑战。从气候科学、能源研究、太空探索、数字生物学到量子计算等领域,NVIDIA Grace CPU超级芯片和Grace Hopper超级芯片为全球最先进的HPC和AI平台奠定了基础。”
早期采用者引领创新
美国和欧洲的领先超级计算中心都将率先采用这两款超级芯片。
洛斯阿拉莫斯国家实验室(LANL)于今日宣布,其新一代系统Venado将成为美国首个采用NVIDIA Grace CPU技术的系统。Venado是使用HPE Cray EX超级计算机构建而成的异构系统,同时将配备Grace CPU超级芯片节点和Grace Hopper超级芯片节点,满足各类新兴应用需求。该系统建成后的AI性能预计将超过10 exaflops。
LANL模拟和计算副总监Irene Qualters表示:“借助NVIDIA Grade Hopper强大性能的支撑,Venado将帮助LANL研究人员继续履行自身的承诺,即在科学领域取得新突破。NVIDIA的加速计算平台和广阔的生态系统能够解决性能瓶颈,助力LANL开展有望造福整个国家和社会的新研究。”
瑞士国家计算中心的新系统Alps同样由慧与基于HPE Cray EX超级计算机而构建。该系统将使用Grace CPU超级芯片,以支持众多领域的开创性研究。Alps将作为一个通用系统,向瑞士及其他国家的研究者开放。
NVIDIA Grace为计算密集型工作负载提速
NVIDIA Grace CPU超级芯片搭载两个基于Arm®的CPU,它们通过高带宽、低延迟、低功耗的NVIDIA NVLink®-C2C互连技术连接。这项开创性的设计内置多达144个高性能Arm Neoverse核心,并且带有可伸缩矢量扩展和1 TB/s的内存子系统。
Grace CPU超级芯片支持最新的PCIe Gen5协议,可实现与GPU之间最高性能连接,同时还能连接NVIDIA ConnectX®-7智能网卡以及NVIDIA BlueField®-3 DPU以保障HPC及AI工作负载安全。
Grace Hopper超级芯片在一个集成模块中通过NVLink-C2C连接NVIDIA Hopper GPU与NVIDIA Grace CPU,满足HPC和超大规模AI应用需求。
基于NVIDIA Grace的系统将运行NVIDIA AI和NVIDIA HPC软件产品组合,实现全栈式集成计算。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。