最新MLCommons结果公布英特尔展现强大AI推理性能

今日，MLCommons公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的MLPerf推理v3.1性能基准测试结果，其中包括英特尔所提交的基于Habana Gaudi2 加速器、第四代英特尔至强可扩展处理器，以及英特尔至强CPU Max系列的测试结果。

英特尔产品在全新MLCommons AI推理性能测试中尽显优势

今日，MLCommons公布针对 60 亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的 MLPerf推理v3.1 性能基准测试结果，其中包括英特尔所提交的基于Habana^® Gaudi^®2 加速器、第四代英特尔^®至强^®可扩展处理器，以及英特尔^®至强^® CPU Max 系列的测试结果。该结果显示了英特尔在AI推理方面极具竞争力的表现，并进一步加强了其对加速从云到网络到边缘再到端的工作负载中大规模部署AI的承诺。

英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示：“正如最新的 MLCommons结果显示，我们拥有强大的、具有竞争力的人工智能产品组合以满足客户对高性能、高效率的深度学习推理及训练的需求，同时，针对各种规模的人工智能模型，英特尔产品组合均具有领先的性价比优势。”

根据6月披露的MLCommons AI训练结果和Hugging Face性能基准测试验证，Gaudi2 在先进的视觉语言模型上拥有卓越的性能，而今天的结果进一步证明了英特尔能够提供满足AI计算需求的绝佳解决方案。

考虑到客户的个性化需求，英特尔正在通过能够帮助解决AI工作负载中推理与训练问题的产品，让AI无处不在。英特尔的AI产品为客户提供了可根据各自性能、效率及目标成本进行灵活匹配以获取最佳AI解决方案的理想选择，同时亦帮助客户开放生态系统。

关于Habana Gaudi2的测试结果：

Habana Gaudi2 在GPT-J模型上的推理结果强有力地验证了其具有竞争力的性能。

Gaudi2 在GPT-J-99 和GPT-J-99.9 上的服务器查询和离线样本的推理性能分别为78.58 次/秒和84.08 次/秒。
Gaudi2 提交的结果采用 FP8数据类型，并在这种新数据类型上达到了 99.9% 的准确率。

随着每6-8周公布的 Gaudi2 软件更新，英特尔将继续在 MLPerf 基准测试中展现其产品的性能提升，以及持续扩大的模型覆盖范围。

最新MLCommons结果公布英特尔展现强大AI推理性能

Habana Gaudi2 在GPT-J模型上的推理结果验证了其具有竞争力的性能

关于第四代至强可扩展处理器的测试结果：

英特尔提交了基于第四代英特尔至强可扩展处理器的7个推理基准测试，其中包括GPT-J模型。结果显示，包括视觉、语言处理、语音和音频翻译模型，以及更大的 DLRM v2 深度学习推荐模型及ChatGPT-J 模型在内，第四代至强处理器对于通用 AI 工作负载拥有出色的性能。此外，截至目前，英特尔仍是唯一一家使用行业标准的深度学习生态系统软件提交公开 CPU 结果的厂商。

第四代英特尔至强可扩展处理器是通过流行的AI框架与库构建及部署通用AI工作负载的理想选择。对于GPT-J对约 1000-1500 字新闻稿进行100 字总结的任务，第四代至强可扩展处理器可在离线模式下完成每秒两段的总结提要，在实时服务器模式下完成每秒一段的总结提要。
英特尔首次提交了英特尔至强CPU Max 系列的MLPerf 结果，该系列可提供高达64 GB的高带宽内存。对于 GPT-J而言，它是仅有的能够达到 99.9% 准确度的 CPU，这对于对精度要求极高的应用来说至关重要。
英特尔与OEM厂商合作提交了测试结果，进一步展示了其AI性能的可扩展性，以及基于英特尔至强处理器的通用服务器的可获取性，充分满足客户服务水平协议 (SLA)。

最新MLCommons结果公布英特尔展现强大AI推理性能

第四代至强可扩展处理器是构建及部署通用AI工作负载的理想选择

MLPerf 是业内享有盛名的 AI 性能基准测试，旨在实现公平、可重复的产品性能比较。英特尔计划为下一个 MLPerf测试提交新的AI训练性能结果。持续的性能更新彰显了英特尔致力于帮助客户、助力AI技术演进所迈出的每一步，无论是低成本的AI处理器，还是面向网络、云和企业用户的高性能AI硬件加速器或是 GPU。

来源：业界供稿

英特尔

0赞

好文章，需要你的鼓励

最新MLCommons结果公布 英特尔展现强大AI推理性能

来源：业界供稿

2023

09/13

09:44

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

HPE Gen12：英特尔至强6加持，数据中心和边缘计算的“新宠”

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔：旗下的“主打”18A 产品将于2025 年下半年投产

英特尔至强6加持下的火山引擎，要降低大模型的应用门槛

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

最新MLCommons结果公布英特尔展现强大AI推理性能