从边缘到云 NVIDIA继续引领MLPerf AI推理基准测试原创

作者：李祥敬

AI加速落地，而不管是训练还是推理，都离不开坚实的算力支撑。NVIDIA以全面的产品组合覆盖从云到数据中心、边缘的AI场景，MLPerf的测试结果展现了NVIDIA产品的实力，赋能企业AI的部署与应用。

AI计算力正在成为新一轮科技革命和产业变革的重要方法和工具。如今，AI已进入大规模推理时代。

MLPerf是影响力最广的国际AI性能基准评测，其推理性能评测涵盖使用广泛的六大AI场景，比如计算机视觉、自然语言处理、推荐系统、语音识别等，每个场景采用最主流的AI模型作为测试任务，每一任务又分为数据中心和边缘两类场景。

MLPerf凭借其透明性和客观性使用户能够做出明智的购买决定。该基准测试得到了包括亚马逊、Arm、百度、谷歌、哈佛大学、英特尔、Meta、微软、斯坦福大学和多伦多大学在内的广泛支持。

在近日公布的MLPerf AI推理基准测试结果中，NVIDIA协众多产品继续一骑绝尘，其中NVIDIA H100 GPU创造多项世界纪录、A100 GPU在主流性能方面展现领先优势、Jetson AGX Orin在边缘计算方面处于领先地位。

NVIDIA H100 GPU

NVIDIA H100 GPU基于Hopper架构，该芯片与两年前推出的上一代Ampere芯片相比，性能提升4.5倍。

从边缘到云 NVIDIA继续引领MLPerf AI推理基准测试

NVIDIA H100 GPU首次亮相MLPerf AI推理基准测试便表现不俗，其提高了本轮测试所有六个神经网络中的单加速器性能标杆，它在单个服务器和离线场景中展现出吞吐量和速度方面的领先优势。

BERT是MLPerf AI模型中规模最大、对性能要求最高的的模型之一。Hopper在流行的用于自然语言处理的BERT模型上表现出色部分归功于其Transformer Engine。

Transformer Engine结合了数据格式和算法，并可通过所使用的Transformer机器学习系统加速硬件性能。

据悉，H100 GPU还将参加未来的MLPerf训练基准测试。

NVIDIA A100 GPU

作为市场主流产品，NVIDIA A100 GPU继续在主流AI推理性能方面展现出全方位领先，

在数据中心和边缘计算类别与场景中，A100 GPU赢得的测试项超过了任何其他提交的结果。A100还在6月的MLPerf训练基准测试中取得了全方位的领先，展现了其在整个AI工作流中的能力。

A100还在6月的MLPerf训练基准测试中取得了全方位的领先，展现了其在整个AI工作流程中的能力。

自2020年7 月在MLPerf上首次亮相以来由于NVIDIA AI软件的不断改进，A100 GPU的性能已经提升了6倍。

NVIDIA AI是唯一能够在数据中心和边缘计算中运行所有 MLPerf 推理工作负载和场景的平台。

NVIDIA Jetson AGX Orin

人工智能（AI）的实效性、物联网设备的采用以及边缘计算的性能都在近期取得了显著的进步，进而释放了边缘AI的潜能。

NVIDIA Jetson AGX Orin模块是NVIDIA Jetson 家族的最新成员并且在其中具有最强大的性能。Orin将NVIDIA Ampere架构GPU和强大的Arm CPU内核集成到一块芯片中。

从边缘到云 NVIDIA继续引领MLPerf AI推理基准测试

在边缘计算方面，NVIDIA Orin运行了所有MLPerf基准测试，是所有低功耗系统级芯片中赢得测试最多的芯片。

在上一轮基准测试中，Orin的运行速度和平均能效分别比上一代 Jetson AGX Xavier模块高出5倍和2倍。

在能效方面，Orin边缘AI推理性能提升多达50%。

目前，Orin现已被用在NVIDIA Jetson AGX Orin开发者套件以及机器人和自主系统生产模块，并支持完整的NVIDIA AI 软件堆栈,，包括自动驾驶汽车平台（NVIDIA Hyperion）、医疗设备平台（Clara Holoscan）和机器人平台（Isaac）。

广泛的NVIDIA AI生态系统

MLPerf结果显示，NVIDIA AI得到了业界最广泛的机器学习生态系统的支持。

在这一轮基准测试中，有超过70项提交结果在NVIDIA平台上运行。例如，Microsoft Azure提交了在其云服务上运行NVIDIA AI的结果。

此外，10家系统制造商的19个NVIDIA 认证系统参加了本轮基准测试，包括华硕、戴尔科技、富士通、技嘉、慧与、联想、超微等。

结语

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

从边缘到云 NVIDIA继续引领MLPerf AI推理基准测试 原创

来源：至顶网计算频道

2022

09/09

11:50

分享

点赞

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

多站点IT基础设施升级指南：告别VMware的替代方案

戴尔集成Elasticsearch与英伟达Blackwell GPU升级AI数据平台

Confluent Cloud为智能体提供实时数据流处理能力

数字化转型失败的6个警示信号

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

NVIDIA Blackwell 现已在云端全面可用

专访DeepMind CEO：我们距离实现AGI只需5-10年

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

从边缘到云 NVIDIA继续引领MLPerf AI推理基准测试原创