第一时间适配！英特尔锐炫GPU在运行Llama 3时展现卓越性能

在Meta发布Llama 3大语言模型的第一时间，英特尔即优化并验证了80亿和700亿参数的Llama 3模型能够在英特尔AI产品组合上运行。在客户端领域，英特尔锐炫(TM)显卡的强大性能让开发者能够轻松在本地运行Llama 3模型，为生成式AI工作负载提供加速。

在Meta发布Llama 3大语言模型的第一时间，英特尔即优化并验证了80亿和700亿参数的Llama 3模型能够在英特尔AI产品组合上运行。在客户端领域，英特尔锐炫™显卡的强大性能让开发者能够轻松在本地运行Llama 3模型，为生成式AI工作负载提供加速。

在Llama 3模型的初步测试中，英特尔^®酷睿™Ultra H系列处理器展现出了高于普通人阅读速度的输出生成性能，而这一结果主要得益于其内置的英特尔锐炫GPU，该GPU具有8个Xe核心，以及DP4a AI加速器和高达120 GB/s的系统内存带宽。

英特尔酷睿Ultra处理器和英特尔锐炫显卡在Llama 3模型发布的第一时间便提供了良好适配，这彰显了英特尔和Meta携手为本地AI开发和数百万设备的部署所做出的努力。英特尔客户端硬件性能的大幅提升得益于用于本地研发的PyTorch和英特尔^® PyTorch扩展包等丰富的软件框架与工具，以及用于模型部署和推理的OpenVINO™工具包。

第一时间适配！英特尔锐炫GPU在运行Llama 3时展现卓越性能

在内置英特尔锐炫显卡的英特尔酷睿 Ultra 7上运行Meta-Lama3-8B-Instruct

第一时间适配！英特尔锐炫GPU在运行Llama 3时展现卓越性能

在英特尔锐炫A770上运行Llama 3的下一个Token延迟

上图展示了在搭配PyTorch框架和针对英特尔GPU的优化后，英特尔锐炫A770显卡在运行Llama 3模型时表现出卓越的性能。除此之外，英特尔锐炫显卡亦支持开发者在本地运行包括Mistral-7B-Instruct LLM、Phi2、Llama2等在内的大语言模型。

基于相同的基础安装，开发者可以在本地运行多种模型的主要原因，可以归功于IPEX-LLM，即一个针对PyTorch的大语言模型库。它主要基于英特尔^® PyTorch扩展包打造，涵盖时下最新的大语言模型优化和低比特数据压缩（INT4/FP4/INT8/FP8），以及针对英特尔硬件的大多数最新性能优化。得益于如锐炫A系列显卡等英特尔独立显卡上的Xe核心XMX AI加速功能，IPEX-LLM能够显著提高性能，其支持在Windows子系统Linux版本2、原生Windows环境和原生Linux上的英特尔锐炫A系列显卡。

由于所有的操作和模型均基于原生PyTorch框架，开发者可以非常方便地更换或使用不同的PyTorch模型以及输入数据。而上述模型和数据不仅能够在英特尔锐炫显卡上运行，开发者亦能享受到英特尔锐炫显卡加速带来的性能提升。

产品和性能信息

英特尔^®酷睿™Ultra处理器：

在英特尔酷睿Ultra 7 155H平台（MSI Prestige 16 AI Evo B1MG-005US）上进行测试，使用32GB LP5x 6400Mhz总内存，英特尔显卡驱动101.5382 WHQL，Windows 11 Pro版本22631.3447，平衡操作系统电源计划，最佳性能操作系统电源模式，极限性能MSI Center模式，已启用核心隔离，基于英特尔2024年4月17日的测试。

英特尔锐炫™A系列显卡：

在英特尔锐炫A770 16GB显卡上进行测试，使用英特尔酷睿 i9-14900K、华硕ROG MAXIMUS Z790 HERO主板、32GB（2x 16GB）DDR5 5600Mhz，Corsair MP600 Pro XT 4TB NVMe。软件配置包括英特尔显卡驱动101.5382 WHQL、Windows 11 Pro版本22631.3447、性能电源策略和核心隔离禁用。基于英特尔2024年4月17日的测试。

注释：

性能因使用情况、配置和其他因素而异。可在性能指数网站上了解更多信息。

性能结果基于所示日期的配置测试，可能不反映所有公开可用的更新。请参阅附件以了解配置详情。没有任何产品或组件可以绝对安全。

基于预生产系统和组件的结果，以及使用英特尔参考平台（内部新系统的内部示例）、英特尔内部分析或架构模拟或建模估算或模拟的结果，仅供参考。结果可能会因将来对任何系统、组件、规格或配置的更改而变化。

成本和结果可能会有所不同。

英特尔技术可能需要启用硬件、软件或服务进行激活。

来源：业界供稿

英特尔

0赞

好文章，需要你的鼓励

第一时间适配！英特尔锐炫GPU在运行Llama 3时展现卓越性能

产品和性能信息

来源：业界供稿

2024

04/23

16:50

分享

点赞

供应商秘密"修复"导致关键应用在营业时间无法使用

Proxmox发布数据中心管理器，打造VMware替代方案

AWS re:Invent 2025云服务企业级AI智能体技术重大发布会

Microsoft Ignite 2025：Azure 重磅发布，一文读懂！

Werner Out，但Builders的传奇才刚开始！re:Invent 2025 Dr. Werner谢幕演讲！

以硬核基座，托举Agentic AI颠覆创新！re:Invent 2025 Peter&Dave主题演讲回顾！

以伙伴优势共筑AI Agent新时代！re:Invent 2025 Dr. Ruba Borno演讲精华回顾

靠谱、高效的构建AI Agent实操手册！re:Invent 2025 Swami博士主题演讲划重点！

通往数十亿Agents的未来！re:Invent 2025 Matt Garman主题演讲精华！

Google DeepMind造出"全能游戏玩家"：SIMA 2在虚拟世界里自由行动，还会自己学新技能

HPE扩展AI原生产品，以构建自动驾驶的网络战略重塑IT运营未来

OpenAI CTO 访谈：扎克伯格为了挖我们的人甚至亲手做汤送到家里，Scaling Law没死，过去两周每天都工作到凌晨一点

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

HPE Gen12：英特尔至强6加持，数据中心和边缘计算的“新宠”

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔：旗下的“主打”18A 产品将于2025 年下半年投产

英特尔至强6加持下的火山引擎，要降低大模型的应用门槛

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: