Nvidia今天推出了两款用于高性能计算和人工智能工作负载的芯片新品。
本周Nvidia在德国汉堡举行的ISC高性能计算大会上宣布推出了这两款芯片——Nvidia Grace CPU Superchip和Nvidia Grace Hopper Superchip,旨在为新一代的百亿亿级计算机服务器提供动力。
Nvidia表示,Nvidia Grace CPU超级芯片基于是Nvidia首款基于Arm的CPU(代号也是Grace)。该芯片配置了两个基于Arm的CPU提供支持,并通过高带宽、低延迟的Nvidia NVLink-C2C进行连接。Nvidia称这是一个“突破性的设计”,其中包含了多达144个Arm Neoverse内核,采用了Scalable Vector Extension和性能达每秒1 TB的内存系统。
Nvidia Grace CPU Superchip与PCIe Gen5协议接口,可以轻松链接到Nvidia最新的GPU,用于人工智能和机器学习工作负载,也可以与Nvidia BlueField-3 DPU连接,用于高性能计算应用。
至于Nvidia Grace Hopper超级芯片,这是一个更强大的系统,结合了Nvidia Hopper GPU与Nvidia Grace CPU,是一个通过NVLink-C2C连接的集成模块,用于高性能计算和大规模人工智能工作负载。
Nvidia表示,这两个新系统都运行Nvidia的人工智能和高性能计算软件的完整产品组合,支持“全栈的、集成的计算”。
这两个系统主要针对OEM厂商,特别是计算机服务器制造商,而且这些客户会立即采用这些芯片,首批搭载Grace超级芯片的系统将于今年晚些时候推出,包括戴尔、HPE、联想、浪潮、技嘉、超微和Atos。Nvidia承诺,将会给这些OEM厂商带来更高性能、更大内存带宽、更高能效等诸多优势。
而且Nvidia正在试图让几家知名客户来为自己背书,其中包括美国国防部的洛斯阿拉莫斯国家实验室。
洛斯阿拉莫斯实验室公布了一套名为Venado的新型高性能计算系统,号称是使用HPE Cray EX超级计算机构建的“异构系统”,将混合使用Grace CPU超级芯片节点和Grace Hopper超级芯片。一旦系统开始运行,预计性能将超过10 exaflops,并得到广泛应用。
洛斯阿拉莫斯实验室模拟和计算副主任Irene Qualters表示:“Venado系统为LANL的研究人员带来了Nvidia Grace Hopper的高性能水平,将继续致力于推动科学突破的界限。Nvidia的加速计算平台和广阔的生态系统正在消除性能上的障碍,使该实验室能够有新的发现,造福国家和整个社会。”
Nvidia的另一个主要客户是瑞士国家计算中心,该中心表示,他们的新系统也将由HPE Cray EX超级计算机构建。该中心表示,这套计划中的系统将配置多个Grace CPU超级芯片,将作为一种面向通用研究的先进平台提供服务。
Nvidia公司超大规模和高性能计算副总裁Ian Buck表示,超级计算领域正在进入百亿亿次人工智能的新时代,这将让研究人员能够应对以前那些遥不可及的挑战。
他说:“在气候科学、能源研究、太空探索、数字生物学、量子计算等领域,Nvidia Grace CPU超级芯片和Grace Hopper超级芯片构成了世界上最先进的高性能计算和人工智能平台的基础。”
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。