NVIDIA AI Enterprise和VMware vSphere with Tanzu简化企业AI开发和应用管理

NVIDIA和VMware联合开发AI-ready企业平台,将全球领先的AI堆栈和经过优化的软件带入全球数十万家企业所使用的基础设施中,树立了双方合作的又一里程碑。
VMware在10月5日的VMworld 2021上发布了最新版本的VMware Tanzu for vSphere 。这一工作负载管理软件使IT团队能够在其现有的IT基础设施上运行容器化Kubernetes工作负载。
企业现在可以运用Tanzu for vSphere和NVIDIA AI Enterprise软件套件对其AI项目进行测试。NVIDIA AI Enterprise于2021年8月上市,是一套经NVIDIA优化、认证和支持的端到端的云原生AI和数据分析软件套件,用于在现代混合云中快速部署、管理和扩展AI工作负载。
向行业MLPerf基准测试提交AI虚拟化结果
戴尔科技EMC PowerEdge R7525服务器近期在MLPerf基准测试中使用三个NVIDIA A100 Tensor Core GPU运行NVIDIA AI Enterprise和VMware vSphere,取得了94.4%至100%的等效裸机性能。
这是厂商第二次提交关于虚拟化基础设施的MLPerf结果,反映了NVIDIA AI Enterprise架构如何在现代数据中心的加速行业标准中心服务器上驱动先进的AI工作负载。
AI和IT:珠联璧合
现代AI工作负载需要专门的基础设施和软件,这一复杂性给在企业数据中心和混合云中支持这些先进应用的IT团队带来了挑战。NVIDIA AI Enterprise通过弥合IT运营、数据科学家和应用开发者之间的鸿沟,缩短AI开发周期,帮助客户项目更快投产。
通过NVIDIA AI Enterprise和VMware vSphere with Tanzu,开发者能够在VMware环境中的Kubernetes容器上运行AI工作负载,充分利用方便IT部门管理的基础设施。该软件可在领先的服务器制造商所提供的主流NVIDIA认证系统上运行,从而提供了一个完整的、专为AI优化的集成式软件堆栈和硬件堆栈。
VMware云平台业务部营销副总裁Lee Caswell表示:“VMware通过简化基础设施的复杂性为企业提供服务。我们与NVIDIA合作,使客户能够在其混合云上开发和部署先进的AI应用。凭借适用于VMware vSphere的NVIDIA AI Enterprise和VMware Tanzu,客户可以在主流数据中心服务器和云端管理AI的开发和部署,从而轻松集成驱动各行业增长的AI应用。”
面向开发者和IT的企业级AI
NVIDIA AI Enterprise提供专为开发者优化的AI软件,包括PyTorch、TensorFlow、NVIDIA TensorRT、NVIDIA Triton 推理服务器和NVIDIA RAPIDS。这些工具使AI开发者和数据科学家能够轻松获得构建对话式AI、计算机视觉和推荐系统等一系列企业AI应用所需的工具和框架。
NVIDIA AI Enterprise的云原生架构使IT部门能够集中管理其混合云基础设施中的所有集群和应用。该软件提供接近裸机水平的AI性能,包括在虚拟化环境中。因此,IT团队可以帮助开发者在构建模型时能够快速探索想法并进行迭代。
客户首选的广泛生态系统
NVIDIA AI Enterprise得到了多家提供NVIDIA认证系统的服务器制造商的支持。这些制造商包括
源讯、戴尔科技、技嘉、新华三、慧与、浪潮、联想和超微,这些厂商均采用NVIDIA A100和NVIDIA A30等NVIDIA GPU。
NVIDIA AI Enterprise通过全球NVIDIA渠道合作伙伴提供,包括Atea、Axians、Carahsoft Technology 公司、Computacenter、Insight Enterprises、NTT、Presidio、Sirius、SoftServe、SVA System Vertrieb Alexander GmbH、TD SYNNEX、Trace3和WWT。为支持需要即时访问AI基础设施的客户,NVIDIA AI Enterprise预计也将在不久后加入数字基础设施领导者Equinix提供的NVIDIA AI LaunchPad计划。
适用于 VMware vSphere 的NVIDIA AI Enterprise现已全面上市,软件的试用版许可证也将向希望试用NVIDIA AI Enterprise和VMware vSphere with Tanzu的客户开放。戴尔科技验证的AI设计是VMware vSphere上首个联合设计的NVIDIA AI Enterprise软件解决方案,该解决方案也于今天上市。
好文章,需要你的鼓励
2025年,企业技术高管面临巨大压力,需要帮助企业从持续的AI投入中获得回报。大多数高管取得了进展,完善了项目优先级排序方法。然而,CIO仍面临AI相关问题。支离破裂的AI监管环境和宏观经济阻力将继续推动技术高管保持谨慎态度。随着AI采用增长的影响不断显现,一些CIO预期明年将带来劳动力策略变化。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
FinOps基金会周四更新了其FinOps开放成本和使用规范云成本管理工具,新版本1.3更好地支持多供应商工作流。该版本新增了合同承诺和协商协议数据集,增加了跨工作负载成本分摊跟踪列,以及云支出和使用报告时效性和完整性的元数据可见性。随着云和AI采用推动企业IT预算增长,技术供应商正在关注将成本与价值联系起来的努力。大型企业通常使用三到四家云供应商,小企业可能使用两家,同时还有数据中心、SaaS和许可等服务。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。