NVIDIA 今日宣布, 戴尔科技、慧与和联想将率先在其服务器产品阵容中集成专为 AI 量身定制的 NVIDIA Spectrum-X™ 以太网络技术,帮助企业客户加速生成式 AI 业务。
Spectrum-X 专为生成式 AI 量身定制,为企业提供了一种全新的以太网络,相较传统以太网方案,其 AI 通信网络性能提高了 1.6 倍。
这三家头部系统制造商的新系统,整合了 Spectrum-X 与 NVIDIA Tensor Core GPU、NVIDIA AI Enterprise 软件和 NVIDIA AI Workbench 软件,为企业通过生成式 AI 来实现业务转型奠定了基础。
NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI 和加速计算正在推动新一代的业务转型,企业需要升级其数据中心来满足新型业务的需求。加速网络就是 NVIDIA 的头部服务器制造商合作伙伴推出新一代系统的催化剂,加快他们迈向生成式AI新时代。”
戴尔科技集团董事长兼首席执行官 Michael Dell 表示:“加速计算和加速网络是构建支撑大语言模型和生成式 AI 应用系统的关键。戴尔科技和 NVIDIA 将携手合作,为客户提供基础设施和软件,使他们可以快速、安全地发掘出数据的潜力。”
慧与总裁兼首席执行官 Antonio Neri 表示:“毫无疑问,生成式AI将推动各行各业的创新。这些强大的新型应用将需要一个全新的架构来支持各种不同的动态工作负载。为使客户能够充分挖掘生成式 AI 的潜力,慧与与 NVIDIA 携手共建系统平台,专们面向新型应用所需的性能、效率和可扩展性等需求。”
联想集团董事会主席兼首席执行官杨元庆表示:“生成式 AI 推动了前所未有的变革,但也对企业的基础设施提出了更加苛刻的要求。通过与 NVIDIA 密切合作,联想正在从网络、计算和软件等各个层面全方位构建高效的加速系统,满足现代 AI 应用的需求。”
专门用于加速 AI 的网络
为实现 AI 业务的最佳效率,Spectrum-X 集性能优异的 Spectrum-4 以太网交换机、NVIDIA BlueField-3® SuperNIC(一款可以大幅提升超大规模 AI 业务性能的新型网络加速器)以及多种加速软件于一体。全球领先的基础设施计算平台 —— NVIDIA BlueField-3 DPU 就属于 Spectrum-X 的一部分。
Spectrum-4 是全球首款专门面向 AI 的 51Tb/sec 以太网交换机,可在大规模、满负荷的场景下提供超高的数据吞吐量,同时在 AI 云业务的多租户场景下将网络拥塞降到了最低,其智能的、基于微调的路由技术可以保障网络基础设施的最大利用率。
BlueField-3 SuperNIC 专为网络密集型的大规模并行计算而设计,可在 GPU 服务器之间提供高达 400Gb/s 的 RDMA(RoCE - RDMA over Converged Ethernet)网络连接,大幅提升了集群内部基于东西网络流量的 AI 训练和推理性能,还能实现多租户数据中心环境的安全隔离,确保租户业务的可预测性和性能隔离。BlueField-3 SuperNIC 基于低功耗、半高半长的 PCIe 规格设计,是企业级服务器的理想选择。
NVIDIA 加速软件包括 Cumulus Linux、SONiC 和 NetQ 三者组成的性能优异的 Spectrum-X 软件开发套件,以及作为 BlueField 核心的 NVIDIA DOCA™ 软件框架。
NVIDIA AI Enterprise 为安全、稳定和已经支持的生产级 AI 业务提供了框架、预训练模型和开发工具。NVIDIA AI Workbench 使开发者能够在 PC 或工作站上快速创建、测试和自定义预训练生成式 AI 模型,然后将其扩展至几乎任何数据中心或云。
搭载 Spectrum-X 的 NVIDIA 超级计算机
NVIDIA 自己的一台超级计算机就在使用 Spectrum-X,这也是新一代 AI 系统的参考架构。该超级计算机由 NVIDIA 与戴尔科技联合开发,使用了基于 8 卡 NVIDIA Hopper GPU 的 HGX™ 平台和 BlueField-3 DPU 及 SuperNIC 的 Dell PowerEdge XE9680 服务器,并通过 Spectrum-4 交换机组成了集群系统。
供应情况
基于全套 NVIDIA AI 解决方案的戴尔服务器、慧与服务器和联想服务器预计将于明年一季度推出。
好文章,需要你的鼓励
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。
谷歌发布基于Gemini 3的快速低成本模型Flash,并将其设为Gemini应用和AI搜索的默认模型。新模型在多项基准测试中表现优异,在MMMU-Pro多模态推理测试中得分81.2%超越所有竞品。该模型已向全球用户开放,并通过Vertex AI和API向企业及开发者提供服务。定价为每百万输入token 0.5美元,输出token 3美元,速度比2.5 Pro快三倍且更节省token用量。
这项由伊利诺伊大学香槟分校等四所院校联合完成的研究,提出了名为DaSH的层次化数据选择方法。该方法突破了传统数据选择只关注单个样本的局限,通过建模数据的天然层次结构,实现了更智能高效的数据集选择。在两个公开基准测试中,DaSH相比现有方法提升了高达26.2%的准确率,同时大幅减少了所需的探索步数。