2024 年 6 月 2 日,NVIDIA 与全球多家领先计算机制造商于今日共同发布一系列采用 NVIDIA Blackwell 架构的系统,这些系统搭载 Grace CPU 以及 NVIDIA 网络和基础设施,助力于企业建立 AI 工厂和数据中心,推动新一轮生成式 AI 突破。
NVIDIA 创始人兼首席执行官黄仁勋在其 COMPUTEX 主题演讲中宣布,永擎电子、华硕、技嘉、鸿佰科技、英业达、和硕、QCT、Supermicro、纬创资通和纬颖将使用 NVIDIA GPU 和网络打造云、专用系统、嵌入式和边缘 AI 系统。
“新一轮工业革命已经开始。众多企业和地区正在与 NVIDIA 合作推动价值万亿美元的传统数据中心向加速计算转型,并建造一种新型数据中心——AI 工厂来生产新的商品:人工智能。”黄仁勋表示 ,“从服务器、网络和基础设施制造商到软件开发商,整个行业正在准备使用 Blackwell 来加速各个领域实现 AI 驱动的创新。”
为了满足各类应用的需求,所发布产品配置丰富,涵盖了从单 GPU 到多 GPU、从 x86 到 Grace、从风冷到液冷技术等。
此外,为了加快不同规模和配置的系统开发,NVIDIA MGX™ 模块化参考设计平台加入了对 NVIDIA Blackwell 产品的支持,包括全新 NVIDIA GB200 NVL2 平台,该平台专为主流大语言模型推理、检索增强生成和数据处理提供卓越的性能而打造。
GB200 NVL2 非常适合用于数据分析等新兴领域,企业每年在这些领域的支出高达数百亿美元。借助 NVLink®-C2C 互连技术带来的高带宽内存性能和 Blackwell 架构中专有的解压缩引擎,较使用x86 CPU时数据处理速度可提高最多达 18 倍,能效提高了 8 倍。
适用于加速计算的模块化参考架构
为了满足全球数据中心多样化的加速计算需求,NVIDIA MGX 为计算机制造商提供了一个参考架构,以便其能够以快速且低成本的方式构建超过 100 种的系统设计配置。
制造商首先可根据其服务器机箱选择一种基本的系统架构,然后再根据不同的工作负载选择 GPU、DPU 和 CPU。目前,已有超过 25 家合作伙伴的 90 多套已发布或正在开发中的系统使用了 MGX 参考架构,较去年来自 6 家合作伙伴的 14 套系统有了显著的增加。通过采用 MGX,开发成本大幅降低,较之前最多降低了四分之三,开发时间缩短到仅六个月,较之前减少了三分之二。
AMD 和英特尔都支持 MGX 架构,并首次计划打造基于他们自己 CPU 主机处理器的模块设计,其中包括下一代 AMD Turin 平台和基于 P 核心的第六代英特尔®至强®处理器(原 Granite Rapids)。任何服务器系统厂商都可以借助这些参考设计节省开发时间,并确保设计和性能的一致性。
NVIDIA 的最新平台 GB200 NVL2 也采用了 MGX 和 Blackwell。在横向扩展能力上,采用单一节点设计,就可以支持各种不同的系统配置和网络选项,将加速计算无缝集成到现有的数据中心基础设施中。
GB200 NVL2 现已加入 Blackwell 产品阵容,该阵容涵盖的其他产品还包括 NVIDIA Blackwell Tensor Core GPU、GB200 Grace Blackwell 超级芯片和 GB200 NVL72。
统一的生态系统
NVIDIA 拥有一个全面的合作伙伴生态系统,包括全球领先的半导体制造商和 NVIDIA 代工合作伙伴 TSMC,以及为建造 AI 工厂提供关键组件的全球电子制造商,包括了很多在服务器机架、供电和冷却方案等制造领域的创新成果,这些成果来自安费诺、奇鋐科技(AVC)、Cooler Master、Colder Products Company(CPC)、丹佛斯、台达和光宝科技等公司。
受益于此,现在可以快速开发和部署新数据中心基础设施,满足全球企业的需求,Blackwell 技术、NVIDIA Quantum-2 或 Quantum-X800 InfiniBand 网络平台、NVIDIA Spectrum™-X 以太网平台以及 NVIDIA BlueField®-3 DPU 通过头部系统制造商戴尔科技、慧与和联想等服务器系统进一步加速数据中心的开发和部署。
企业级用户还可以使用包含 NVIDIA NIM™ 推理微服务的 NVIDIA AI Enterprise 软件平台,来创建和运行生产级生成式 AI 应用。
行业拥抱Blackwell
黄仁勋在本次 COMPUTEX 主题演讲中还宣布,各大领先企业正在迅速采用 Blackwell,利用 AI 为自身业务赋能。
台湾地区的一流医疗中心长庚纪念医院计划使用 NVIDIA Blackwell 计算平台推进生物医学研究并加速影像和语言应用,以此改善临床工作流程,提升患者感受。
全球最大电子制造商之一 Foxconn 正计划使用 NVIDIA Grace Blackwell 来开发用于 AI 电动汽车和机器人平台的智能解决方案,以及日益增长的基于语言的生成式 AI 服务,以为其客户打造更加个性化的体验。
合作伙伴荐言
更多有关 NVIDIA Blackwell 和 MGX 平台的信息,请观看黄仁勋的 COMPUTEX 主题演讲。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。