NVIDIA 今日宣布, 戴尔科技、慧与和联想将率先在其服务器产品阵容中集成专为 AI 量身定制的 NVIDIA Spectrum-X™ 以太网络技术,帮助企业客户加速生成式 AI 业务。
Spectrum-X 专为生成式 AI 量身定制,为企业提供了一种全新的以太网络,相较传统以太网方案,其 AI 通信网络性能提高了 1.6 倍。
这三家头部系统制造商的新系统,整合了 Spectrum-X 与 NVIDIA Tensor Core GPU、NVIDIA AI Enterprise 软件和 NVIDIA AI Workbench 软件,为企业通过生成式 AI 来实现业务转型奠定了基础。
NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI 和加速计算正在推动新一代的业务转型,企业需要升级其数据中心来满足新型业务的需求。加速网络就是 NVIDIA 的头部服务器制造商合作伙伴推出新一代系统的催化剂,加快他们迈向生成式AI新时代。”
戴尔科技集团董事长兼首席执行官 Michael Dell 表示:“加速计算和加速网络是构建支撑大语言模型和生成式 AI 应用系统的关键。戴尔科技和 NVIDIA 将携手合作,为客户提供基础设施和软件,使他们可以快速、安全地发掘出数据的潜力。”
慧与总裁兼首席执行官 Antonio Neri 表示:“毫无疑问,生成式AI将推动各行各业的创新。这些强大的新型应用将需要一个全新的架构来支持各种不同的动态工作负载。为使客户能够充分挖掘生成式 AI 的潜力,慧与与 NVIDIA 携手共建系统平台,专们面向新型应用所需的性能、效率和可扩展性等需求。”
联想集团董事会主席兼首席执行官杨元庆表示:“生成式 AI 推动了前所未有的变革,但也对企业的基础设施提出了更加苛刻的要求。通过与 NVIDIA 密切合作,联想正在从网络、计算和软件等各个层面全方位构建高效的加速系统,满足现代 AI 应用的需求。”
专门用于加速 AI 的网络
为实现 AI 业务的最佳效率,Spectrum-X 集性能优异的 Spectrum-4 以太网交换机、NVIDIA BlueField-3® SuperNIC(一款可以大幅提升超大规模 AI 业务性能的新型网络加速器)以及多种加速软件于一体。全球领先的基础设施计算平台 —— NVIDIA BlueField-3 DPU 就属于 Spectrum-X 的一部分。
Spectrum-4 是全球首款专门面向 AI 的 51Tb/sec 以太网交换机,可在大规模、满负荷的场景下提供超高的数据吞吐量,同时在 AI 云业务的多租户场景下将网络拥塞降到了最低,其智能的、基于微调的路由技术可以保障网络基础设施的最大利用率。
BlueField-3 SuperNIC 专为网络密集型的大规模并行计算而设计,可在 GPU 服务器之间提供高达 400Gb/s 的 RDMA(RoCE - RDMA over Converged Ethernet)网络连接,大幅提升了集群内部基于东西网络流量的 AI 训练和推理性能,还能实现多租户数据中心环境的安全隔离,确保租户业务的可预测性和性能隔离。BlueField-3 SuperNIC 基于低功耗、半高半长的 PCIe 规格设计,是企业级服务器的理想选择。
NVIDIA 加速软件包括 Cumulus Linux、SONiC 和 NetQ 三者组成的性能优异的 Spectrum-X 软件开发套件,以及作为 BlueField 核心的 NVIDIA DOCA™ 软件框架。
NVIDIA AI Enterprise 为安全、稳定和已经支持的生产级 AI 业务提供了框架、预训练模型和开发工具。NVIDIA AI Workbench 使开发者能够在 PC 或工作站上快速创建、测试和自定义预训练生成式 AI 模型,然后将其扩展至几乎任何数据中心或云。
搭载 Spectrum-X 的 NVIDIA 超级计算机
NVIDIA 自己的一台超级计算机就在使用 Spectrum-X,这也是新一代 AI 系统的参考架构。该超级计算机由 NVIDIA 与戴尔科技联合开发,使用了基于 8 卡 NVIDIA Hopper GPU 的 HGX™ 平台和 BlueField-3 DPU 及 SuperNIC 的 Dell PowerEdge XE9680 服务器,并通过 Spectrum-4 交换机组成了集群系统。
供应情况
基于全套 NVIDIA AI 解决方案的戴尔服务器、慧与服务器和联想服务器预计将于明年一季度推出。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。