NVIDIA认证系统计划进一步扩展,迎来更多合作伙伴,支持更多GPU和工作负载

为响应这一需求,NVIDIA认证系统计划在领先供应商的系统中将NVIDIA GPU与NVIDIA网络相结合。这些系统符合NVIDIA设计最佳实践,且在性能、可管理性、可扩展性和安全性等方面的配置均通过了一系列认证测试。

随着GPU加速应用在AI、数据分析、计算机辅助设计和计算机生成图像等领域中日渐重要,企业也面临着一个问题,即如何大规模支持这些工作负载,他们已无法承受每部署一个新的加速应用都需要为之设计和构建自定义硬件的时间成本。

为响应这一需求,NVIDIA认证系统计划在领先供应商的系统中将NVIDIA GPU与NVIDIA网络相结合。这些系统符合NVIDIA设计最佳实践,且在性能、可管理性、可扩展性和安全性等方面的配置均通过了一系列认证测试。

选择NVIDIA认证系统,企业可放心选择预配置且性能优化的服务器,赋能其各规模加速计算工作负载。

更多合作伙伴与GPU选择

今年1月首次发布以来,NVIDIA认证系统计划进展显著。华硕、源讯(Atos)、BOXX Technologies、富士通、新华三、联想、宁畅和QCT等合作伙伴的多款新系统均获得了认证。

此外,如今认证对象还包括NVIDIA A40(旨在实现最佳的图形功能)和NVIDIA T4 Tensor Core GPU(旨在助力打造经济型低功率系统)。其与NVIDIA A100一样,都旨在满足客户对最佳计算性能的需求。敬请访问NVIDIA认证系统页面,查看所有支持的GPU和网络组件。

部分最新NVIDIA认证系统厂商

迄今为止,已有超十家合作伙伴推出了近40种NVIDIA认证系统,而且每月都有更多新系统获得认证。请登陆认证服务器目录页面,查看已经获得认证的服务器和GPU,或询问您选择的厂商目前提供哪些已认证的服务器。我们将在未来的认证计划中加入更多新款NVIDIA GPU,包括最近发布的A30A10

涵盖更广泛的工作负载

采用NVIDIA认证系统的主要优点之一,是此配置适用于多类型的加速工作负载。认证测试套件通过运行一套能够代表多种现实应用的软件,来检查每种服务器设计的性能和功能。

计划发布以来,我们已对认证测试套件进行了扩展,新增了更多有代表性的工作负载,并通过更多方式来训练服务器。测试所包含的部分应用如下:

  • 使用TensorFlow和PyTorch进行的深度学习训练,包括多节点训练
  • 使用TensorRT和Triton推理服务器进行的AI推理
  • 使用RAPIDSApache Spark的数据科学
  • 使用CUDA和NVIDIA HPC SDK的核加速算法
  • 使用Blender、Octane、Redshift和V-Ray进行的批渲染

测试还包括端到端AI应用工作流程,其能够通过多种方式对系统进行训练,并根据实际应用来验证其配置是否足够完善。这些测试均使用NVIDIA NGC目录中的NVIDIA AI框架进行,包括:用于智能视频分析的NVIDIA DeepStream、用于医疗应用的NVIDIA Clara以及用于对话式AI的NVIDIA Jarvis

此外,还有多项功能测试旨在确保服务器配置能够实现最佳的可管理性、安全性和可扩展性。这些测试包括:

  • 使用Redfish进行远程管理
  • 使用TPM、ChipSec和UEFI保障主机安全
  • 网络性能
  • 使用GPUDirect RDMAGPUDirect Storage加速数据传输

总而言之,测试套件能够模拟企业客户在数据中心会遇到的应用和用例。系统必须通过所有测试的性能阈值才能获得认证。

NVIDIA认证系统测试套装涉及领域

 

全面的企业级软件支持

企业若有意愿将现代化加速计算从数据科学和开发者领域引入您领域的主流应用,NVIDIA提供具备全面的企业级软件包支持。

NVIDIA认证系统提供运行这些应用的服务器平台。系统中优化的设计、可预测的性能和扩展能力,使其成为助力企业级加速计算解决方案实施的最优选择。

上月,NVIDIA在GTC大会上发布了:

  • NVIDIA AI Enterprise  —— 一款端到端云原生AI和数据分析软件套件。该套件经过NVIDIA的优化、认证和支持,可通过NVIDIA认证系统在VMware vSphere上运行。它包括NVIDIA提供的重要使能技术和软件,能够在现代混合云中实现AI工作负载的快速部署、管理和扩展。NVIDIA通过NVIDIA认证系统运行NVIDIA AI Enterprise软件中的各项测试,以确保在vSphere上的最佳性能和功能。
  • NVIDIA Omniverse Enterprise ——一款用于虚拟协作和仿真模拟的革命性平台。各种领先的软件工具之间具备一键式互操作性,让分布在全球各地的团队能够加速工作流程,在一个共享虚拟世界中开展无缝协作。该平台包括获许可后可用的软件,以及全方位的企业支持。NVIDIA Omniverse Enterprise经过优化,可在数据中心中的NVIDIA认证系统上、NVIDIA RTX笔记本电脑以及工作站上运行。

NVIDIA认证系统配置指南

NVIDIA认证系统经过验证,具有运行常规加速计算工作负载的最佳基础配置。客户可通过调整配置,来更好匹配他们在这些系统上运行的主要工作负载。例如,如果他们计划使用大型模型进行深度学习训练,则可在服务器上添加多个GPU。

客户可参考《NVIDIA认证系统配置指南》进行配置,该指南为推理和深度学习训练的服务器拓扑和系统配置提供了建议,未来还将增加对其他工作负载的建议。该指南详细介绍了组件尺寸和平衡、PCIe拓扑结构、存储等。对于想要调整NVIDIA认证系统基本配置的客户,这份全新的指南确保其始终拥有最优的设计。

来源:业界供稿

0赞

好文章,需要你的鼓励

2021

05/17

14:54

分享

点赞

邮件订阅
白皮书