英特尔向AMD与英伟达GPU发起挑战

如今的英特尔公司明显决定走上Alphabet董事长兼斯坦福大学前任校长John L. Hennessy提出的“特定领域架构”战略之路。为此，英特尔已经在CPU、GPU、各类ASIC以及FPGA等领域全面开花。

英特尔专为高性能计算（HPC）打造的Xe GPU似乎确有一战之力，但能否成功压制住AMD和英伟达还在未知之天。

如今的英特尔公司明显决定走上Alphabet董事长兼斯坦福大学前任校长John L. Hennessy提出的“特定领域架构”战略之路。为此，英特尔已经在CPU、GPU、各类ASIC以及FPGA等领域全面开花。虽然这种到处试水的作法有点“大力出奇迹”的意味，但也确实在塑造异构计算领域带来了不小的吸引力。但很明显，这种方式要求极高的资本密度、耗费大量工程资源，同时也会给软件开发者带来巨大的负担。在今天的文章中，我们就具体聊聊其中一种架构——作为英特尔家族全新补充成员的高性能GPU。

英特尔最近公布了即将推出的数据中心GPU Xe HPC的详细信息，这款产品代号为Ponte Vecchio（PVC）。英特尔大胆暗示，PVC GPU的峰值性能约为当前最快GPU英伟达A100的两倍。2022年，阿贡国家实验室的百亿亿次超级计算机Aurora就将采用PVC与Sapphire Rapids（多区块下一代至强处理器）构建。从这个角度看，这项技术本身应该已经相当成熟。

Ponte Vecchio X^e HPC GPU

英特尔希望用这款GPU产品在高性能计算（64位浮点运算）与AI（8位/16位整数与16位浮点运算）方面对抗AMD与英伟达。Xe HPC采用一种多区块、多进程节点封装方案，采用新的GPU核心、HBM2e存储器、新的Xe Link互连以及使用超过1000亿个晶体管实现的PCIe Gen 5。考虑到实际尺寸，高频工作时的功耗就成了新的问题。但从Xe的设计中可以看出，英特尔很明显是有条有理：封装较小晶片不仅有助于降低开发与制造成本、同时也能缩短产品的上市时间。

英特尔向AMD与英伟达GPU发起挑战

Ponte Vecchio采用多区块、多进程节点封装。

Ponte Vecchio预计将于明年年初开始向阿贡国家实验室的Aurora供货，届时将由数万块GPU为这台由美国能源部资助的全球首台百亿亿次级超级计算机提供算力，实际性能至少可达成1.1百亿亿次浮点运算。

英特尔向AMD与英伟达GPU发起挑战

Ponte Vecchio承诺在英特尔的HPC与AI领域发挥重要作用。

初步性能声明无疑令人印象深刻，其表现可达英伟达A100的约两倍，矢量引擎每秒可提供45万亿次FP32触发操作，矩阵处理单元则可实现1468 INT8 TOPS。这款怪物级芯片的功耗约为600瓦，发热量肯定低不了。下图为英特尔公司在今年8月的架构日活动上公布的演示文稿。虽然没有做出横向对比，但这里呈现的肯定是最佳性能，也似乎再次强化了“两倍于A100”的结论。

英特尔向AMD与英伟达GPU发起挑战

Xe平台包含片上互连链路与开关，可高效扩展至8 GPU。

另一个有趣的点，在于英特尔会如何对Xe HPC与Habana Labs Gaudi进行区别定位。一种可能的猜测是将Ponte Vecchio推向HPC超级计算，而Gaudi则重点关注云服务商的可扩展训练平台。这很大程度上取决于英特尔打算为两款产品投入多少资源以吸引相应的软件团队。

软件: OneAPI

除了直观的规格与码数之争，英特尔应该还会利用Aurora围绕Ponte Vecchio GPU构建开发者社区，包括将OneAPI全面引入AI与HPC领域。英特尔公司从来没有放弃过为高性能计算和AI提供单一抽象这个雄心勃勃、但又困难重重的目标。在最近的简报中，英特尔公司重申了这方面意图，并带来了不少令人信服的证据。可以看到，OneAPI正在获得市场的认可与接纳。我们虽然担心Habana还是无法支持该软件，但就目前的情况看，这种兼容性也确实不算高优先级任务。

英特尔向AMD与英伟达GPU发起挑战

英特尔表示，目前已经有80多款HPC与AI应用程序能够支持早期Ponte Vecchio芯片上的OneAPI。成绩不错，但别忘了英伟达CUDA可是有数百家支持者。

总结

英特尔在GPU方面的成就给我留下了深刻印象。但Ponte Vecchio还需要克服两道难关才能真正取代AMD与英伟达：其一是保持合理的功耗，其二则是实现软件的易用性与高优化度。第二点尤其重要，英特尔必须简化代码并优化模型、降低使用难度，才能让声明的性能水平真正成为用户手中的可用资源。

在我看来，在Pat Gelsinger的英明领导下，Ponte Vecchio无疑有机会成为英特尔进军新时代的先锋与典范。最终表现如何，让我们拭目以待。

来源：业界供稿

英特尔

0赞

好文章，需要你的鼓励

英特尔向AMD与英伟达GPU发起挑战

英特尔专为高性能计算（HPC）打造的Xe GPU似乎确有一战之力，但能否成功压制住AMD和英伟达还在未知之天。

Ponte Vecchio Xe HPC GPU

软件: OneAPI

总结

来源：业界供稿

2021

09/17

17:21

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

HPE Gen12：英特尔至强6加持，数据中心和边缘计算的“新宠”

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔：旗下的“主打”18A 产品将于2025 年下半年投产

英特尔至强6加持下的火山引擎，要降低大模型的应用门槛

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Ponte Vecchio X^e HPC GPU