NVIDIA AI Enterprise和VMware vSphere with Tanzu简化企业AI开发和应用管理
NVIDIA和VMware联合开发AI-ready企业平台,将全球领先的AI堆栈和经过优化的软件带入全球数十万家企业所使用的基础设施中,树立了双方合作的又一里程碑。
VMware在10月5日的VMworld 2021上发布了最新版本的VMware Tanzu for vSphere 。这一工作负载管理软件使IT团队能够在其现有的IT基础设施上运行容器化Kubernetes工作负载。
企业现在可以运用Tanzu for vSphere和NVIDIA AI Enterprise软件套件对其AI项目进行测试。NVIDIA AI Enterprise于2021年8月上市,是一套经NVIDIA优化、认证和支持的端到端的云原生AI和数据分析软件套件,用于在现代混合云中快速部署、管理和扩展AI工作负载。
向行业MLPerf基准测试提交AI虚拟化结果
戴尔科技EMC PowerEdge R7525服务器近期在MLPerf基准测试中使用三个NVIDIA A100 Tensor Core GPU运行NVIDIA AI Enterprise和VMware vSphere,取得了94.4%至100%的等效裸机性能。
这是厂商第二次提交关于虚拟化基础设施的MLPerf结果,反映了NVIDIA AI Enterprise架构如何在现代数据中心的加速行业标准中心服务器上驱动先进的AI工作负载。
AI和IT:珠联璧合
现代AI工作负载需要专门的基础设施和软件,这一复杂性给在企业数据中心和混合云中支持这些先进应用的IT团队带来了挑战。NVIDIA AI Enterprise通过弥合IT运营、数据科学家和应用开发者之间的鸿沟,缩短AI开发周期,帮助客户项目更快投产。
通过NVIDIA AI Enterprise和VMware vSphere with Tanzu,开发者能够在VMware环境中的Kubernetes容器上运行AI工作负载,充分利用方便IT部门管理的基础设施。该软件可在领先的服务器制造商所提供的主流NVIDIA认证系统上运行,从而提供了一个完整的、专为AI优化的集成式软件堆栈和硬件堆栈。
VMware云平台业务部营销副总裁Lee Caswell表示:“VMware通过简化基础设施的复杂性为企业提供服务。我们与NVIDIA合作,使客户能够在其混合云上开发和部署先进的AI应用。凭借适用于VMware vSphere的NVIDIA AI Enterprise和VMware Tanzu,客户可以在主流数据中心服务器和云端管理AI的开发和部署,从而轻松集成驱动各行业增长的AI应用。”
面向开发者和IT的企业级AI
NVIDIA AI Enterprise提供专为开发者优化的AI软件,包括PyTorch、TensorFlow、NVIDIA TensorRT、NVIDIA Triton 推理服务器和NVIDIA RAPIDS。这些工具使AI开发者和数据科学家能够轻松获得构建对话式AI、计算机视觉和推荐系统等一系列企业AI应用所需的工具和框架。
NVIDIA AI Enterprise的云原生架构使IT部门能够集中管理其混合云基础设施中的所有集群和应用。该软件提供接近裸机水平的AI性能,包括在虚拟化环境中。因此,IT团队可以帮助开发者在构建模型时能够快速探索想法并进行迭代。
客户首选的广泛生态系统
NVIDIA AI Enterprise得到了多家提供NVIDIA认证系统的服务器制造商的支持。这些制造商包括
源讯、戴尔科技、技嘉、新华三、慧与、浪潮、联想和超微,这些厂商均采用NVIDIA A100和NVIDIA A30等NVIDIA GPU。
NVIDIA AI Enterprise通过全球NVIDIA渠道合作伙伴提供,包括Atea、Axians、Carahsoft Technology 公司、Computacenter、Insight Enterprises、NTT、Presidio、Sirius、SoftServe、SVA System Vertrieb Alexander GmbH、TD SYNNEX、Trace3和WWT。为支持需要即时访问AI基础设施的客户,NVIDIA AI Enterprise预计也将在不久后加入数字基础设施领导者Equinix提供的NVIDIA AI LaunchPad计划。
适用于 VMware vSphere 的NVIDIA AI Enterprise现已全面上市,软件的试用版许可证也将向希望试用NVIDIA AI Enterprise和VMware vSphere with Tanzu的客户开放。戴尔科技验证的AI设计是VMware vSphere上首个联合设计的NVIDIA AI Enterprise软件解决方案,该解决方案也于今天上市。
好文章,需要你的鼓励
微软将在今年夏季晚些时候推出Windows恢复力计划,著名的Windows蓝屏死机将被新的黑屏替代。这一变化是微软对2024年7月CrowdStrike故障事件的回应,该事件导致约850万台Windows设备瘫痪。作为Windows恢复力计划的一部分,微软正在重新设计Windows代码,让安全软件在内核外运行,以提高系统稳定性和恢复能力,减少因第三方安全软件问题导致的系统崩溃。
香港理工大学研究团队开发了突破性医学AI系统GEMeX-ThinkVG,让人工智能在分析胸片时能像医生一样详细解释诊断过程。该系统不仅能准确回答医学问题,还能标注具体的影像区域并提供完整的推理链条,解决了传统医学AI"黑盒子"问题。通过创新的强化学习训练方法,仅用八分之一数据就达到了传统方法的性能水平,为可解释医学AI开辟了新方向。
随着GPU成为AI工作负载训练和运营的关键,越来越多的云服务提供商开始提供云GPU实例。这为希望避免部署GPU硬件费用和复杂性的组织带来好消息。云GPU实例可按超大规模与专业化提供商、通用与专用实例、共享与独占服务器进行分类。选择时需考虑工作负载类型、GPU类型、成本、延迟和控制级别等因素。
希腊雅典理工大学团队开发CultureMERT-95M多文化音乐AI模型,通过两阶段持续预训练和任务算术方法,让AI系统学会理解希腊、土耳其、印度等非西方音乐传统。该模型在非西方音乐分类任务上提升4.9%准确率,同时保持西方音乐理解能力,为构建更包容的全球音乐AI系统奠定基础。