打破常规！英特尔至强CPU为AI时代大模型推理提供全新选择原创

作者：李祥敬

步入AI时代，算力驱动芯片架构的持续创新，而英特尔的CPU也在持续进化，旨在全方位响应时代和客户的需求，让CPU的价值得以体现。

生成式AI引发的算力需求在持续增加，企业纷纷转向GPU，不过现实却很残酷，缺货、禁运等问题成了棘手难题。

英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰告诉记者，大模型是对业务的辅助，比如聊天机器人、内容生成、提纲分析等，这些只是帮助企业提高生产力。尤其是在私有云上，企业没有必要再重新部署新的GPU平台。因为一个新的平台意味着需要考虑开发、运维等因素，成本有可能增加，而这对于企业来说也可能会成为负担。在CPU上运行大模型是一个非常好的选择。

基于已有认知，CPU并非是运行大模型的选择，然而，第五代英特尔至强可扩展处理器的问世让CPU运行大模型成为了现实。那么英特尔是如何做到的呢？

将硬件能力转化为用户价值

第五代英特尔至强可扩展处理器不仅针对不同工作负载实现了性能优化、助力高能效计算，并通过CPU将AI应用到更多场景，同时也为客户提供了较高的运营效率和可扩展的安全功能。

打破常规！英特尔至强CPU为AI时代大模型推理提供全新选择

英特尔资深技术专家表示，从架构角度看，第五代英特尔至强可扩展处理器实现了制程技术改进、芯片布局、性能与能效、末级缓存和内存IO等方面的革新。

比如，第五代英特尔至强可扩展处理器基于Intel 7的制程，在系统的漏电流控制和动态电容方面进行了改进。通过这些调整，第五代至强在同等功耗下的频率可以提升3%，其中有2.5%是由漏电流控制贡献的，动态电容下降贡献了0.5%。

算力的提升需要更多的芯片核心，以及更多的内存带宽，更多的内存带宽意味着更多的IO。这些都在推动芯片面积不断增加，这会给芯片的良品率带来挑战。

现在主流的芯片设计都是把一颗CPU芯片切分成多个子芯片，用多芯片的方式封装在一个芯片上面。第五代至强通过把四片芯片改成两片芯片的设计，利用了EMIB技术实现芯片之间的高效互连，更好地对芯片的面积进行控制。

在性能和能效方面，第五代至强升级到Raptor Cove核心，核心数增加，从最多的60核升级到64核。与此同时，虽然处理器性能提升了，但是待机功耗下降。英特尔处理器全集成供电模块（FIVR）可实现更高的片上电源转换效率，增强主动空闲模式可以提高数据中心的供电有效性，帮助客户真正达到节电的目标。

此外，第五代至强支持高达5600MT/s传输的DDR5，并通过英特尔UPI 2.0增加带宽，提供高达20GT/s传输，并支持CXL Type 3工作流。值得一提的是，该处理器还能通过英特尔SGX/TDX为使用中的云端数据提供端到端硬件级防护能力。

借助这些功能更新，在工作负载性能表现方面，相较于第三代产品，第五代至强可扩展处理器在AI推理训练上最高提升了14倍，基础架构的存储能够达到2.8倍，网络边缘可以达到3.2倍，高性能计算能达到3倍，数据分析可以达到3.7倍。

强大AI能力加速客户AI应用落地

在过去的10年，英特尔致力于构建一个完备的生态，通过软、硬件结合帮助生态合作伙伴们充分挖掘和利用底层CPU能力。

英特尔在框架层、函数库层面上挖掘硬件能力，通过API接口调用把底层硬件能力完全应用起来。同时，在系统层、服务器层面上，将CPU、内存，以及网络整合成一个统一的有机整体。

打破常规！英特尔至强CPU为AI时代大模型推理提供全新选择

英特尔资深技术专家表示，英特尔始终致力于在CPU上部署AI，对于通用的AI工作负载，英特尔采用AMX和AVX-512两个指令集，并基于OpenVINO对整个模型进行优化、量化。

面向AI时代，英特尔也在逐步优化CPU的架构。除了传统的CPU普通核计算之外，第五代至强可扩展处理器具备AMX加速功能，能够将许多矩阵运算从普通的CPU中卸载到AMX上面，通过专用加速器处理专用的业务逻辑，性能便会大幅提升。

借助分布式架构，CPU在推理方面的性能表现并不弱。基于硬件和软件的优化，第五代至强和第四代至强相比，在AI训练、实时推理、批量推理上，基于不同的算法，都可以看到不同性能的提升，最高可提升40%。

新一代至强的AI加速功能已经得到了合作伙伴的验证。例如百度云基于第五代至强的服务器，提供了可以在CPU上运行的大型计算模型的服务。在京东基于第五代至强的应用中，和前一代的处理器相比，亦在Llama2 13B的模型上，实现了50%的性能提升。

企业引入基于至强处理器的生成式AI服务，如聊天机器人或是知识库问答这种大模型应用，初期成本可以降低50%。

结语

目前，英特尔已经加速了产品迭代速度，并确保产品路线图能够有效执行。2024年，英特尔的下一代至强可扩展处理器也将迎来更新。

打破常规！英特尔至强CPU为AI时代大模型推理提供全新选择

具备多达288个核心的能效核（E-core）处理器——Sierra Forest将于2024年上半年推出，性能核（P-core）处理器Granite Rapids也将紧随其后发布。

能效核（E-core）处理器主要是面向新兴云原生应用的高密度超高能效的运算进行能效的优化，以实现极致的每瓦性能。

步入AI时代，算力驱动芯片架构的持续创新，而英特尔的CPU也在持续进化，旨在全方位响应时代和客户的需求，让CPU的价值得以体现。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

打破常规！英特尔至强CPU为AI时代大模型推理提供全新选择 原创

来源：至顶网计算频道

2024

03/21

09:07

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打破常规！英特尔至强CPU为AI时代大模型推理提供全新选择原创