NVIDIA 今日宣布, 戴尔科技、慧与和联想将率先在其服务器产品阵容中集成专为 AI 量身定制的 NVIDIA Spectrum-X™ 以太网络技术,帮助企业客户加速生成式 AI 业务。
Spectrum-X 专为生成式 AI 量身定制,为企业提供了一种全新的以太网络,相较传统以太网方案,其 AI 通信网络性能提高了 1.6 倍。
这三家头部系统制造商的新系统,整合了 Spectrum-X 与 NVIDIA Tensor Core GPU、NVIDIA AI Enterprise 软件和 NVIDIA AI Workbench 软件,为企业通过生成式 AI 来实现业务转型奠定了基础。
NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI 和加速计算正在推动新一代的业务转型,企业需要升级其数据中心来满足新型业务的需求。加速网络就是 NVIDIA 的头部服务器制造商合作伙伴推出新一代系统的催化剂,加快他们迈向生成式AI新时代。”
戴尔科技集团董事长兼首席执行官 Michael Dell 表示:“加速计算和加速网络是构建支撑大语言模型和生成式 AI 应用系统的关键。戴尔科技和 NVIDIA 将携手合作,为客户提供基础设施和软件,使他们可以快速、安全地发掘出数据的潜力。”
慧与总裁兼首席执行官 Antonio Neri 表示:“毫无疑问,生成式AI将推动各行各业的创新。这些强大的新型应用将需要一个全新的架构来支持各种不同的动态工作负载。为使客户能够充分挖掘生成式 AI 的潜力,慧与与 NVIDIA 携手共建系统平台,专们面向新型应用所需的性能、效率和可扩展性等需求。”
联想集团董事会主席兼首席执行官杨元庆表示:“生成式 AI 推动了前所未有的变革,但也对企业的基础设施提出了更加苛刻的要求。通过与 NVIDIA 密切合作,联想正在从网络、计算和软件等各个层面全方位构建高效的加速系统,满足现代 AI 应用的需求。”
专门用于加速 AI 的网络
为实现 AI 业务的最佳效率,Spectrum-X 集性能优异的 Spectrum-4 以太网交换机、NVIDIA BlueField-3® SuperNIC(一款可以大幅提升超大规模 AI 业务性能的新型网络加速器)以及多种加速软件于一体。全球领先的基础设施计算平台 —— NVIDIA BlueField-3 DPU 就属于 Spectrum-X 的一部分。
Spectrum-4 是全球首款专门面向 AI 的 51Tb/sec 以太网交换机,可在大规模、满负荷的场景下提供超高的数据吞吐量,同时在 AI 云业务的多租户场景下将网络拥塞降到了最低,其智能的、基于微调的路由技术可以保障网络基础设施的最大利用率。
BlueField-3 SuperNIC 专为网络密集型的大规模并行计算而设计,可在 GPU 服务器之间提供高达 400Gb/s 的 RDMA(RoCE - RDMA over Converged Ethernet)网络连接,大幅提升了集群内部基于东西网络流量的 AI 训练和推理性能,还能实现多租户数据中心环境的安全隔离,确保租户业务的可预测性和性能隔离。BlueField-3 SuperNIC 基于低功耗、半高半长的 PCIe 规格设计,是企业级服务器的理想选择。
NVIDIA 加速软件包括 Cumulus Linux、SONiC 和 NetQ 三者组成的性能优异的 Spectrum-X 软件开发套件,以及作为 BlueField 核心的 NVIDIA DOCA™ 软件框架。
NVIDIA AI Enterprise 为安全、稳定和已经支持的生产级 AI 业务提供了框架、预训练模型和开发工具。NVIDIA AI Workbench 使开发者能够在 PC 或工作站上快速创建、测试和自定义预训练生成式 AI 模型,然后将其扩展至几乎任何数据中心或云。
搭载 Spectrum-X 的 NVIDIA 超级计算机
NVIDIA 自己的一台超级计算机就在使用 Spectrum-X,这也是新一代 AI 系统的参考架构。该超级计算机由 NVIDIA 与戴尔科技联合开发,使用了基于 8 卡 NVIDIA Hopper GPU 的 HGX™ 平台和 BlueField-3 DPU 及 SuperNIC 的 Dell PowerEdge XE9680 服务器,并通过 Spectrum-4 交换机组成了集群系统。
供应情况
基于全套 NVIDIA AI 解决方案的戴尔服务器、慧与服务器和联想服务器预计将于明年一季度推出。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。