英特尔至强和AI PC等产品为Meta Llama 3生成式AI工作负载提供加速

Meta今日推出其下一代大语言模型（LLM）——Meta Llama 3。在发布的第一时间，英特尔即优化并验证了80亿和700亿参数的Llama 3模型能够在英特尔至强处理器、英特尔Gaudi加速器、英特尔酷睿Ultra处理器和英特尔锐炫(TM) 显卡的AI产品组合上运行。

英特尔丰富的AI产品——面向数据中心的至强处理器，边缘处理器及AI PC等产品为开发者提供最新的优化，助力其运行Meta新一代大语言模型Meta Llama 3。

Meta今日推出其下一代大语言模型（LLM）——Meta Llama 3。在发布的第一时间，英特尔即优化并验证了80亿和700亿参数的Llama 3模型能够在英特尔^® 至强^® 处理器、英特尔^® Gaudi加速器、英特尔^® 酷睿™ Ultra处理器和英特尔锐炫™ 显卡的AI产品组合上运行。

英特尔副总裁兼人工智能软件工程总经理李炜表示：“英特尔一直积极与AI软件生态系统的领先企业展开合作，致力于提供兼具性能与易用性的解决方案。Meta Llama 3是AI大语言模型重要迭代的新一浪潮。作为AI软硬件产品技术创新的引领者，英特尔很开心能够与Meta合作，充分挖掘诸如Llama 3等模型的潜力，助力生态伙伴开发领先的AI应用。”

重要意义：秉承推动AI无处不在的愿景，英特尔持续深耕软件和AI生态，以确保其产品能够满足AI领域持续变化的创新需求。在数据中心，集成英特尔^®高级矩阵扩展加速引擎（Intel^® AMX）的英特尔至强处理器和英特尔Gaudi能够为满足客户不断变化、多元化的需求提供更多选择。

英特尔酷睿Ultra处理器和英特尔锐炫显卡不仅为开发者提供了本地开发工具，也为在数百万台设备上进行部署提供全面的软件框架和工具支持。其中，包括PyTorch和用于本地研发的英特尔^® PyTorch扩展包，以及用于模型开发和推理的OpenVINO™工具包等。

在英特尔产品上运行Llama 3：英特尔初步测试和评估80亿和700亿参数的Llama 3模型在自身产品上的性能时，使用了包括PyTorch、DeepSpeed、英特尔Optimum Habana库和英特尔PyTorch扩展包在内的开源软件，并提供最新的软件优化。有关更多性能细节，请访问英特尔开发者博客。

英特尔至强处理器能够运行严苛的端到端AI工作负载，同时为了降低延迟，英特尔也通过技术创新来优化大语言模型的推理性能。配备性能核的英特尔^® 至强^® 6处理器（代号Granite Rapids）在运行80亿参数的Llama 3模型推理时，延迟比第四代英特尔^® 至强^® 处理器表现出两倍的提升，并且能够以低于100毫秒的token延迟运行700亿参数的Llama 3模型推理。
英特尔^® Gaudi 2加速器在70亿、130亿和700亿参数的Llama 2模型上具备优化的性能，现在其基于全新的Llama 3模型也有了初步性能测试。随着英特尔Gaudi软件的更新，英特尔能够轻松运行新的Llama 3模型，并为推理和微调生成结果。近期发布的英特尔^® Gaudi 3加速器也支持运行Llama 3。
英特尔酷睿Ultra和英特尔锐炫显卡在运行Llama 3时亦展现出卓越的性能。在初步测试中，英特尔酷睿Ultra处理器已经展现出远高于人类通常阅读速度的输出生成性能。此外，英特尔锐炫™ A770 显卡具备Xe内核中的全新矩阵引擎（Xe Matrix eXtensions，XMX）AI加速和16GB显存，进一步为大语言模型工作负载提供卓越性能。

未来，Meta将增加新的能力、更多模型尺寸以及增强的性能。英特尔也将持续提升自身AI产品性能，以支持这一全新的大语言模型。

_注释：

_{完整的性能声明和配置可在网址查看：}_{https://www.intel.com/content/www/us/en/developer/articles/technical/accelerate-meta-llama3-with-intel-ai-solutions.html}

_{仅在特定的}_H_{系列英特尔}^®_酷睿_{™ Ultra}_{处理器驱动的系统上提供集成的英特尔锐炫}_™_显卡。

来源：业界供稿

英特尔

0赞

好文章，需要你的鼓励

英特尔至强和AI PC等产品为Meta Llama 3生成式AI工作负载提供加速

来源：业界供稿

2024

04/19

17:27

分享

点赞

人工智能时代为何编程技能比以往更重要

AI颠覆云优先战略：混合计算成为唯一出路

谷歌发布JAX-Privacy 1.0：大规模差分隐私机器学习工具库

谷歌量子AI发布新型优化算法DQI：量子计算优化领域的重大突破

缓解电动汽车里程焦虑：简单AI模型如何预测充电桩可用性

Titans + MIRAS：让AI拥有长期记忆能力

Gemini为STOC 2026大会理论计算机科学家提供自动化反馈

夸克AI眼镜持续升级：首次OTA，支持89种语言翻译

让自动驾驶AI学会“聚焦重点"，速度提升7倍却更加安全

TechCrunch创业战场大赛消费和教育科技领域26强公司榜单

新Mac开箱必备：完美工作桌面升级指南

如何使用ChatGPT新增应用集成功能

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

HPE Gen12：英特尔至强6加持，数据中心和边缘计算的“新宠”

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔：旗下的“主打”18A 产品将于2025 年下半年投产

英特尔至强6加持下的火山引擎，要降低大模型的应用门槛

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: