全新的 NVIDIA Spectrum-X 网络平台集 NVIDIA Spectrum-4、BlueField-3 DPU和加速软件于一身;全球头部云服务提供商采用该平台来横向扩展其生成式 AI服务

全新的 NVIDIA Spectrum-X 网络平台结合了 NVIDIA Spectrum-4、BlueField-3 DPU 和加速软件;全球头部云服务提供商采用该平台来横向扩展其生成式 AI 服务
COMPUTEX — 2023 年 5 月 29 日NVIDIA 于今日宣布推出 NVIDIA Spectrum-X 网络平台,该平台是一个加速网络平台,致力于提高基于以太网 AI 云的性能与效率。
NVIDIA Spectrum-X™ 是基于网络创新的新成果而构建 —— 将 NVIDIA Spectrum-4 以太网交换机与 NVIDIA BlueField®-3 DPU 紧密结合,取得了 1.7 倍的整体 AI 性能和能效提升,同时可在多租户环境中提供一致、可预测的性能。Spectrum-X 还提供 NVIDIA 加速软件和软件开发套件(SDK),使开发人员能够构建软件定义的云原生AI应用。
这种端到端的功能交付,可以减少基于transformer的大规模生成式AI模型的运行时间,助力网络工程师、AI数据科学家和云服务商及时取得更好的结果,并更快做出明智的决策。
全球头部超大规模云服务商正在采用 NVIDIA Spectrum-X,包括领先的云创新企业。
作为 NVIDIA Spectrum-X 参考设计的蓝图和测试平台,NVIDIA 正在构建一台超大规模生成式 AI 超级计算机,命名为 Israel-1。它将被部署在 NVIDIA 以色列数据中心,由基于 NVIDIA HGX™ 平台的戴尔 PowerEdge XE9680 服务器, BlueField-3 DPU 和 Spectrum-4 交换机等打造而成。
NVIDIA 网络高级副总裁 Gilad Shainer 表示:“诸如生成式 AI 等革命性技术正在推动各家企业提升数据中心性能的极限,从而获得更多竞争优势。作为新一代以太网络,NVIDIA Spectrum-X 为新一代 AI 工作负载扫清障碍,将会彻底改变整个行业。”
NVIDIA Spectrum-X 网络平台具有高度的通用性,可用于各种 AI 应用。它采用完全标准的以太网,与现有以太网的堆栈实现互通。
该平台起步于 Spectrum-4 ,这是全球首款专为 AI 网络打造的 51Tb/s 以太网交换机。先进的 RoCE 扩展功能可以跨 Spectrum-4 交换机、BlueField-3 DPU 和 NVIDIA LinkX 光纤相互协同,共同构建了一个专为 AI 云优化的端到端 400GbE 网络。
NVIDIA Spectrum-X 通过性能隔离增强了多租户环境,确保租户的 AI 工作负载能以最佳性能持续运行。NVIDIA Spectrum-X 还提供了更好的 AI 性能可见性,它可以识别性能瓶颈,而且具有全自动网络验证功能。
驱动 Spectrum-X 的加速软件包括Cumulus Linux、纯 SONiC 和 NetQ 等性能强大的 NVIDIA SDK,共同助力该网络平台实现极致性能。另外,Spectrum-X 还包括 BlueField DPU 的核心软件——NVIDIA DOCA™ 软件框架。
NVIDIA Spectrum-X 单台交换机即可实现突破性的 256 个 200Gb/s 端口的连接,使用两层叶脊拓扑可以连接 16,000 个端口,以支持 AI 云的增长和扩展,同时保持极高的性能和极低的网络延时。
生态采用情况
提供 NVIDIA Spectrum-X 方案的公司包括戴尔科技、联想和超微。
供货情况
NVIDIA Spectrum-X、Spectrum-4 交换机、BlueField-3 DPU 和 400G LinkX 光纤现已上市。
点评:生成式AI不光对算力有着巨大的需求,同时对网络性能也提出了更高的要求。NVIDIA Spectrum-X以太网平台针对生成式AI应用的网络要求进行了优化,可以提升网络性能,加速生成式AI模型的生成和运行。
好文章,需要你的鼓励
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
这项由CMU与亚马逊AGI联合完成的研究揭示了当前AI系统的重大缺陷:即使最先进的模型也不知道何时该说"我不知道"。研究团队开发的RefusalBench评估系统通过176种语言操作技巧动态生成测试案例,发现顶级AI在多文档任务中的拒绝准确率低于50%。这项研究不仅提供了标准化测试工具,更为构建诚实可靠的AI系统指明了方向。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
这项由中国人民大学联合腾讯开发的LaSeR技术,发现了AI在生成答案最后一刻会无意中透露对答案质量的评估。通过观察这个"最后一词效应",研究人员开发出了一种让AI高效进行自我评估的方法,在几乎不增加计算成本的情况下,大幅提升了AI的自我验证能力,为构建更可信的AI系统开辟了新路径。