Nvidia今天宣布更新Nvidia Hopper加速计算系统阵容,采用Nvidia自己的H100 Tensor Core GPU以及英特尔今天推出的第四代英特尔至强可扩展处理器。
此外,Nvidia的数十家合作伙伴已经宣布推出了他们自己基于这一新硬件组合的服务器系统,Nvidia表示。这些系统的效率要比上一代高出25倍。
Nvidia解释说,英特尔此次推出的新CPU将与Nvidia的GPU结合在新一代Nvidia DGX H100系统中。英特尔第四代Intel Xeon可扩展处理器、Intel Xeon CPU Max系列和英特尔Data Center GPU Max系列于今天发布。英特尔表示,这些处理器在数据中心性能和效率方面实现了重大飞跃,为云、网络和边缘人工智能、以及全球最强大的超级计算机提供了增强的安全性和新功能。
这些CPU提供了工作负载优先的加速和针对特定工作负载调整的高度优化的软件,使用户能够以合适的功率实现合适的性能,以优化总拥有成本。此外,第四代至强处理器可以为客户提供一系列用于管理电源和性能的功能,从而优化利用CPU资源,帮助实现他们的可持续发展目标。
英特尔第四代至强可扩展处理器的一项关键新功能是支持PCIe Gen 5,能够将CPU到GPU的数据传输速率提高一倍,增加的PCIe通道可实现更高密度的GPU和每台服务器内的高速网络。此外,英特尔还提高了人工智能等数据密集型工作负载的性能,同时将网络速度提高到每个连接每秒400 Gb,这意味着服务器和存储阵列之间的数据传输速度会更快。
Nvidia表示,在新的DGX系统中,英特尔的CPU将与8个Nvidia H100 GPU结合使用。Nvidia H100 GPU是Nvidia迄今为止最强大的芯片,包含了800多亿个晶体管,是英特尔新芯片的理想搭档。这些GPU有一系列独特的功能,使其成为高性能计算工作负载的理想选择,包括内置的Transformer Engine和高度可扩展的NVLink互连,使其能够为大型人工智能模型、推荐系统等提供支持。
Constellation Research分析师Holger Mueller表示:“现代人工智能工作负载需要混合使用CPU和GPU计算平台。而且人工智能还取决于处理数据的速度,因此新的DGX设备使用PCIe Gen5是有道理的。现在一切都要看第一批客户和他们的用途。”
Moor Insights & Strategy分析师Patrick Moorhead表示,他对Nvidia最新的DGX系统印象深刻,但他指出,这并不是第一款支持PCIe 5的系统,AMD最新的处理器也具有该功能。他补充说:“我不认为PCIe 5是决定性因素,我认为这可能要归结为降低价格,因为我听说英特尔最近正在提供大幅折扣。”
将有60多款新服务器采用Nvidia DGX H100系统,这些结合了Nvidia GPU和英特尔CPU的服务器来自华硕、源讯、思科、戴尔、富士通、技嘉、HPE、联想、广达和超微。
Nvidia和众多厂商即将推出的这些系统,将利用最新的GPU和CPU硬件来运行工作负载,其效率是传统的纯CPU服务器的25倍。Nvidia声称,这些系统提供了“令人难以置信的每瓦性能”,从而大大降低了功耗。此外,与上一代Nvidia DGX系统相比,最新的硬件将AI训练和推理工作负载的效率提高了3.5倍,从而使拥有成本降低了约3倍。
支持Nvidia新系统的软件也派上了用场。新的DGX H100系统都附带了Nvidia Enterprise AI的免费许可,这是一套人工智能开发工具和部署软件的云原生套件,为用户提供了一个完整的人工智能计划平台。
Nvidia表示,客户可以以Nvidia DGX SuperPod平台的形式购买多个DGX H100系统,该平台本质上是一个小型超级计算平台,可提供高达exaflop级的AI性能。
好文章,需要你的鼓励
IDC数据显示,Arm架构服务器出货量预计2025年将增长70%,但仅占全球总出货量的21.1%,远低于Arm公司年底达到50%市场份额的目标。大规模机架配置系统如英伟达DGX GB200 NVL72等AI处理设备推动了Arm服务器需求。2025年第一季度全球服务器市场达到创纪录的952亿美元,同比增长134.1%。IDC将全年预测上调至3660亿美元,增长44.6%。配备GPU的AI服务器预计增长46.7%,占市场价值近半。
华为诺亚实验室联合多家顶尖院校推出开源机器人编程框架Ark,通过Python优先设计和模块化架构,实现仿真与现实环境的无缝切换。该框架大幅降低机器人编程门槛,支持现代AI技术集成,为机器人学习研究提供统一平台,有望加速机器人技术普及。
AI正在重塑创业公司的构建方式,这是自云计算出现以来最重大的变革。January Ventures联合创始人Jennifer Neundorfer将在TechCrunch All Stage活动中分享AI时代的新规则,涵盖从创意验证、产品开发到团队架构和市场策略的各个方面。作为专注于B2B早期投资的风投合伙人,她将为各阶段创业者提供关键洞察。
网易有道研究团队开发了Confucius3-Math,这是一个专门针对中国K-12数学教育的14B参数AI模型。该模型在多项数学推理测试中表现出色,超越了许多规模更大的竞争对手,训练成本仅需2.6万美元,推理速度比DeepSeek-R1快15倍,能在消费级GPU上高效运行,旨在通过降低AI教育成本来促进教育公平。