x86巨头公布高性能计算(HPC)技术路线图,Ponte Vecchio继任者首度亮相
除了即将登陆全球最强超级计算机、已经拥有几年历史的Ponte Vecchio GPU之外,英特尔终于带来了关于更多高性能计算芯片的细节消息。其中一大亮点,就是将CPU与GPU整合在同一封装之内。
半导体巨头周二在德国汉堡举行的国际超级计算大会上,分享了其以HPC为重点的最新产品路线图。
因为正潜心开发至强Scalable CPU方案,英特尔此次只为HPC应用带来一组独立产品,而这重要的第一枪正是为即将推出的Sapphire Rapids芯片提供高带宽内存(HBM)变体。这款芯片将配备最高64 GB的HBM2e内存,由此将超大规模数据集的快速访问变成可能。
英特尔新兴HPC产品组合的另一大驱动要素,则是其数据中心GPU。这款高性能GPU将基于风头正劲的Ponte Vecchio芯片,也就是英特尔拿来与英伟达A100和AMD Instinct MI200正面竞争的方案。它将使用最高128 GB的HBM2e内存,可从容处理HPC与AI混合工作负载。
英特尔承诺通过Rialto Bridge,在Ponte Vecchio的性能之上再进一步。
为了从Rialto Bridge身上压榨出更多性能,英特尔计划为它搭配一个功率800瓦的模块,并在模块中采用液冷方案。英特尔还将把Rialto Bridge安装到Facebook母公司Meta以及微软等超大规模厂商的OAM 2.0形制设备当中。
而且已经熟悉Ponte Vecchio的开发者,在为Rialto Bridge准备应用软件时也不会遇上什么麻烦。英特尔明确承诺“软件一致性”,表示预计将在2023年年中开始为客户提供Rialto Bridge样品。
Rialto Bridge当然不是计划的终点,接下来才是重头戏。英特尔打算借Falcon Shores项目,将Ponte Vecchio和Sapphire Rapids HBM结合起来。届时,Falcon Shores将同时囊括x86 CPU核心加Xe GPU核心。也正因如此,英特尔决定将Falcon Shores称为“XPU”。
英特尔表示,Falcon Shores将提供比“当前平台”高5倍的每瓦性能、内存容量和内存带宽,我们假定这里说的是英伟达A100以及英特尔、AMD两家的最新服务器CPU。芯片巨头还承诺,Falcon Shores在x86插槽中的计算密度也将达到现有最佳方案的5倍,这里指的可能是AMD的第三代64核Epyc处理器——毕竟英特尔目前在这方面暂时处于落后。
关于Falcon Shores的最大谜团,在于它会采用怎样的x86 CPU核心与Xe GPU核心配置。可能有些变体会只搭载x86核心,有一些则纯使用Xe核心。从这个角度来看,英特尔其实创造出了一种超级灵活的芯片设计,可以同时兼容纯CPU、纯GPU或二者混合,并以“极限带宽”实现内存资源共享。而且与此同时,英特尔也将继续开发较为传统的至强CPU新产品。
Falcon Shores将使用英特尔“埃时代”制程工艺,考虑到2024年推出这个时间节点,预计具体可能会使用20A或18A制程。
为了避免吓跑开发人员,英特尔还承诺推出一种“简化编程模型”,允许开发者自行决定如何将应用程序的不同部分映射至芯片中的x86和Xe核心。
McVeigh还提到,Falcon Shores的混合设计是通过tiles——也就是小芯片——来实现的。如此一来,芯片制造商就能在设计后期拥有更大的芯片配置灵活性。
他补充道,英特尔能够借此调整x86与Xe两种tiles的排列和比例,快速响应市场对于新兴应用的需求。“如果出现新趋势,我们可以快速适应并在设计层面有所体现。”
McVeigh提到,使用tiles来实现灵活设计代表着芯片制造方式中的“革命性”变化。过去几年以来,英特尔曾顺口提到要在多种产品中使用tiles,具体包括Ponte Vecchio、Sapphire Rapids以及即将推出的Meteor Lake等消费级处理器。
尽管英特尔和AMD等公司最近几年来一直在产品中使用小芯片设计,但McVeigh表示小芯片以往的意义更多是在同一芯片的不同部分使用不同的制程工艺。
他强调,“而现在的区别在于,我们可以将不同的tiles放置在相同的区域和接口上,以便随时间推移做出灵活调整。以往,小芯片更多是为了分解架构以简化工艺、提高产量。”
有些朋友可能觉得Falcon Shores的混合CPU-GPU设计听起来耳熟。没错,英伟达也在兼容Arm的Grace CPU上做出了类似的努力。
英伟达计划在Grace Superchip中纳入Grace芯片,其中搭载2个Grace CPU、总计144个核心。这款CPU也将被引入Grace Hopper Superchip,就是在英伟达的下一代Hopper架构中实现Grace CPU与GPU的结合。
而且从目前的情况看,英伟达似乎要比英特尔领先一步。毕竟GPU巨头已经承诺在2023年上半年推出这款Superchip,而英特尔的Falcon Shores则计划在2024年投放市场。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。