英特尔Falcon Shores XPU:一块处理器囊括N个CPU与GPU

除了即将登陆全球最强超级计算机、已经拥有几年历史的Ponte Vecchio GPU之外,英特尔终于带来了关于更多高性能计算芯片的细节消息。其中一大亮点,就是将CPU与GPU整合在同一封装之内。

x86巨头公布高性能计算(HPC)技术路线图,Ponte Vecchio继任者首度亮相

除了即将登陆全球最强超级计算机、已经拥有几年历史的Ponte Vecchio GPU之外,英特尔终于带来了关于更多高性能计算芯片的细节消息。其中一大亮点,就是将CPU与GPU整合在同一封装之内。

半导体巨头周二在德国汉堡举行的国际超级计算大会上,分享了其以HPC为重点的最新产品路线图。

因为正潜心开发至强Scalable CPU方案,英特尔此次只为HPC应用带来一组独立产品,而这重要的第一枪正是为即将推出的Sapphire Rapids芯片提供高带宽内存(HBM)变体。这款芯片将配备最高64 GB的HBM2e内存,由此将超大规模数据集的快速访问变成可能。

英特尔新兴HPC产品组合的另一大驱动要素,则是其数据中心GPU。这款高性能GPU将基于风头正劲的Ponte Vecchio芯片,也就是英特尔拿来与英伟达A100和AMD Instinct MI200正面竞争的方案。它将使用最高128 GB的HBM2e内存,可从容处理HPC与AI混合工作负载。

英特尔Falcon Shores XPU:一块处理器囊括N个CPU与GPU

英特尔承诺通过Rialto Bridge,在Ponte Vecchio的性能之上再进一步。

为了从Rialto Bridge身上压榨出更多性能,英特尔计划为它搭配一个功率800瓦的模块,并在模块中采用液冷方案。英特尔还将把Rialto Bridge安装到Facebook母公司Meta以及微软等超大规模厂商的OAM 2.0形制设备当中。

而且已经熟悉Ponte Vecchio的开发者,在为Rialto Bridge准备应用软件时也不会遇上什么麻烦。英特尔明确承诺“软件一致性”,表示预计将在2023年年中开始为客户提供Rialto Bridge样品。

Falcon Shores XPU:打造CPU与GPU综合体

Rialto Bridge当然不是计划的终点,接下来才是重头戏。英特尔打算借Falcon Shores项目,将Ponte Vecchio和Sapphire Rapids HBM结合起来。届时,Falcon Shores将同时囊括x86 CPU核心加Xe GPU核心。也正因如此,英特尔决定将Falcon Shores称为“XPU”。

英特尔表示,Falcon Shores将提供比“当前平台”高5倍的每瓦性能、内存容量和内存带宽,我们假定这里说的是英伟达A100以及英特尔、AMD两家的最新服务器CPU。芯片巨头还承诺,Falcon Shores在x86插槽中的计算密度也将达到现有最佳方案的5倍,这里指的可能是AMD的第三代64核Epyc处理器——毕竟英特尔目前在这方面暂时处于落后。

英特尔Falcon Shores XPU:一块处理器囊括N个CPU与GPU英特尔雄心勃勃的Falcon Shores计划。

关于Falcon Shores的最大谜团,在于它会采用怎样的x86 CPU核心与Xe GPU核心配置。可能有些变体会只搭载x86核心,有一些则纯使用Xe核心。从这个角度来看,英特尔其实创造出了一种超级灵活的芯片设计,可以同时兼容纯CPU、纯GPU或二者混合,并以“极限带宽”实现内存资源共享。而且与此同时,英特尔也将继续开发较为传统的至强CPU新产品。

Falcon Shores将使用英特尔“埃时代”制程工艺,考虑到2024年推出这个时间节点,预计具体可能会使用20A或18A制程。

为了避免吓跑开发人员,英特尔还承诺推出一种“简化编程模型”,允许开发者自行决定如何将应用程序的不同部分映射至芯片中的x86和Xe核心。

Tile设计:帮助英特尔快速响应市场需求

McVeigh还提到,Falcon Shores的混合设计是通过tiles——也就是小芯片——来实现的。如此一来,芯片制造商就能在设计后期拥有更大的芯片配置灵活性。

他补充道,英特尔能够借此调整x86与Xe两种tiles的排列和比例,快速响应市场对于新兴应用的需求。“如果出现新趋势,我们可以快速适应并在设计层面有所体现。”

McVeigh提到,使用tiles来实现灵活设计代表着芯片制造方式中的“革命性”变化。过去几年以来,英特尔曾顺口提到要在多种产品中使用tiles,具体包括Ponte Vecchio、Sapphire Rapids以及即将推出的Meteor Lake等消费级处理器。

尽管英特尔和AMD等公司最近几年来一直在产品中使用小芯片设计,但McVeigh表示小芯片以往的意义更多是在同一芯片的不同部分使用不同的制程工艺。

他强调,“而现在的区别在于,我们可以将不同的tiles放置在相同的区域和接口上,以便随时间推移做出灵活调整。以往,小芯片更多是为了分解架构以简化工艺、提高产量。”

有些朋友可能觉得Falcon Shores的混合CPU-GPU设计听起来耳熟。没错,英伟达也在兼容Arm的Grace CPU上做出了类似的努力。

英伟达计划在Grace Superchip中纳入Grace芯片,其中搭载2个Grace CPU、总计144个核心。这款CPU也将被引入Grace Hopper Superchip,就是在英伟达的下一代Hopper架构中实现Grace CPU与GPU的结合。

而且从目前的情况看,英伟达似乎要比英特尔领先一步。毕竟GPU巨头已经承诺在2023年上半年推出这款Superchip,而英特尔的Falcon Shores则计划在2024年投放市场。

来源:至顶网计算频道

0赞

好文章,需要你的鼓励

2022

06/02

14:15

分享

点赞

邮件订阅