适用于企业 AI 的软件套件新增了对 VMware vSphere with Tanzu 的生产支持,提供了对 Domino Data Lab Enterprise MLOps 软件的验证,并扩大了 NVIDIA 认证系统和渠道合作伙伴的队伍,更好地为全球各行业提供服务。
随着新的一年到来,NVIDIA 发布了新版 NVIDIA AI Enterprise软件套件,帮助全球企业将现代工作负载添加至其主流服务器。
NVIDIA AI Enterprise 1.1 现已正式推出。经 NVIDIA 优化、认证和支持的新版软件套件包含以下更新:借助 VMware vSphere with Tanzu上的 NVIDIA 软件实现了对容器化 AI 的生产支持;此前,仅试用版本支持该功能。现在,企业可以在 vSphere 上运行加速 AI 工作负载,无论是在 Kubernetes 容器中运行还是在虚机中运行,NVIDIA AI Enterprise 都可为主流 IT 基础设施上的高级 AI 开发提供支持。
借助 VMware vSphere with Tanzu 简化企业 AI,即将纳入 NVIDIA LaunchPad 计划
在 NVIDIA AI Enterprise 1.1 中,客户呼声颇高的一项功能是在 VMware vSphere with Tanzu 上运行时的生产支持。这一功能让开发者能够在 vSphere 环境中的容器和虚机上运行 AI 工作负载。它提供了针对 AI 优化的集成式完整容器化软件和硬件堆栈,且均由 IT 管理,这开启了 NVIDIA 和 VMware 联手打造的这一 AI 就绪型平台的新里程碑。
很快,NVIDIA 会将 VMware vSphere with Tanzu 支持纳入 NVIDIA AI Enterprise 的 NVIDIA LaunchPad 计划,该计划已在全球九个 Equinix 数据中心展开。符合条件的企业可以通过 AI 从业者和 IT 管理员专用实验,免费测试 AI 工作负载和对 AI 工作负载进行原型设计。这些实验展示了如何使用 NVIDIA AI Enterprise 和 VMware vSphere(不久即会加入 Tanzu)开发和管理聊天机器人和推荐系统等常见的 AI 工作负载。
VMware 云基础设施事业部产品营销副总裁 Matt Morgan 表示:“各组织都在加速 AI 和 ML 开发项目,而运行于 NVIDIA AI Enterprise 之上的 VMware vSphere with Tanzu 可借助现代基础设施服务轻松满足 AI 开发需求。VMware 和 NVIDIA 一直在为帮助各工作团队在其企业中利用 AI 而不懈努力,而此次发布则标志着我们的努力迈向了又一个重要里程碑。”
Domino Data Lab MLOps 验证可加速 AI 研究和数据科学生命周期
NVIDIA AI Enterprise 1.1 版本还提供了对采用 VMware vSphere with Tanzu 的 Domino Data Lab Enterprise MLOps 平台的验证。这项新集成可帮助更多公司在主流加速服务器上加速研究、模型开发和模型部署,从而经济高效地扩展数据科学。
Domino Data Lab 战略合作伙伴关系副总裁 Thomas Robinson 表示:“我们与 NVIDIA 的合作迈入了一个崭新阶段,这会进一步帮助企业将模型置于其业务的核心,从而解决全球最具挑战性的问题。我们与 NVIDIA 携手为每家公司提供端到端平台,帮助他们在企业范围内快速、经济高效地部署模型。”
NVIDIA AI Enterprise 1.1 支持 VMware vSphere with Tanzu,并提供对 Domino Data Lab Enterprise MLOps 平台的验证。
为 NVIDIA AI Enterprise 提供 NVIDIA 认证系统的新 OEM 和集成商
随着新版 NVIDIA AI Enterprise 的发布,行业生态系统也在不断扩大:思科和 Hitachi Vantara 率先推出了 NVIDIA 认证系统;为软件套件提供解决方案的优质系统集成商的名单也在不断增加。
采用 NVIDIA A100 Tensor Core GPU的 Cisco UCS C240 M6 机架式服务器是率先通过 NVIDIA 认证的 NVIDIA AI Enterprise 的思科系统。它采用双路 2RU 外形规格,支持各种存储和 I/O 密集型应用程序,例如大数据分析、数据库、协作、虚拟化、整合和高性能计算。
思科产品管理副总裁 Siva Sivakumar 介绍说:“思科正在帮助客户简化混合云和云原生转换。由 Cisco Intersight 提供技术支持、经 NVIDIA 认证的 Cisco UCS 服务器是如今市场上可提供一流 AI 工作负载体验的服务器。适用于 NVIDIA AI Enterprise 的 Cisco UCS C240 M6 机架式服务器允许客户使用部署在其数据中心的同一基础设施和管理软件来添加 AI。”
采用 NVIDIA A100 Tensor Core GPU 的 Hitachi Advanced Server DS220 G2 是 Hitachi Vantara 率先推出的兼容 NVIDIA AI Enterprise 的 NVIDIA 认证系统。通用型双处理器服务器已针对性能和容量进行优化,实现了计算和存储之间的平衡,并可灵活地为各种解决方案和应用程序提供支持。
Hitachi Vantara 产品管理高级副总裁 Dan McConnell 表示:“对于许多企业来说,在部署由 AI 提供支持的质量控制、推荐系统、聊天机器人等新技术时,成本是一个重要考虑因素。使用 Hitachi Advanced Server DS220 G2 的 Hitachi Unified Compute Platform (UCP) solutions 解决方案借助 NVIDIA A100 GPU 实现加速,并已通过 NVIDIA AI Enterprise 认证。它为客户提供了一条理想途径,让客户能够经济实惠地将功能强大的 AI 就绪型基础设施集成到其数据中心。”
另有多家服务器制造商为 NVIDIA AI Enterprise 提供 NVIDIA 认证系统。其中包括 Atos、Dell Technologies、技嘉、新华三、Hewlett Packard Enterprise、浪潮、联想和 Supermicro。他们提供的所有系统均采用 NVIDIA A100、NVIDIA A30 或其他 NVIDIA GPU。此外,客户还可以选择在自己的服务器上部署 NVIDIA AI Enterprise,或者在全球九个区域的 Equinix Metal 中作为服务的裸机基础设施上部署 NVIDIA AI Enterprise。
AMAX、Colfax International、Exxact Corporation 和 Lambda 是符合 NVIDIA AI Enterprise 资格的新系统集成商,已加入全球渠道合作伙伴生态系统。在此之前,Axians、Carahsoft Technology Corp.、Computacenter、Insight Enterprises 、NTT、Presidio、Sirius、SoftServe、SVA System Vertrieb Alexander GmbH、TD SYNNEX 、Trace3 和 World Wide Technology 已成为渠道合作伙伴。
想要体验使用 NVIDIA AI Enterprise 进行开发的企业可通过 NVIDIA LaunchPad 计划申请免费使用精心策划的实验。该计划还提供使用 NVIDIA Fleet Command进行边缘 AI 的实验,以及使用 NVIDIA Base Command进行严苛 AI 开发工作负载的实验。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。