x86巨头公布高性能计算(HPC)技术路线图,Ponte Vecchio继任者首度亮相
除了即将登陆全球最强超级计算机、已经拥有几年历史的Ponte Vecchio GPU之外,英特尔终于带来了关于更多高性能计算芯片的细节消息。其中一大亮点,就是将CPU与GPU整合在同一封装之内。
半导体巨头周二在德国汉堡举行的国际超级计算大会上,分享了其以HPC为重点的最新产品路线图。
因为正潜心开发至强Scalable CPU方案,英特尔此次只为HPC应用带来一组独立产品,而这重要的第一枪正是为即将推出的Sapphire Rapids芯片提供高带宽内存(HBM)变体。这款芯片将配备最高64 GB的HBM2e内存,由此将超大规模数据集的快速访问变成可能。
英特尔新兴HPC产品组合的另一大驱动要素,则是其数据中心GPU。这款高性能GPU将基于风头正劲的Ponte Vecchio芯片,也就是英特尔拿来与英伟达A100和AMD Instinct MI200正面竞争的方案。它将使用最高128 GB的HBM2e内存,可从容处理HPC与AI混合工作负载。
英特尔承诺通过Rialto Bridge,在Ponte Vecchio的性能之上再进一步。
为了从Rialto Bridge身上压榨出更多性能,英特尔计划为它搭配一个功率800瓦的模块,并在模块中采用液冷方案。英特尔还将把Rialto Bridge安装到Facebook母公司Meta以及微软等超大规模厂商的OAM 2.0形制设备当中。
而且已经熟悉Ponte Vecchio的开发者,在为Rialto Bridge准备应用软件时也不会遇上什么麻烦。英特尔明确承诺“软件一致性”,表示预计将在2023年年中开始为客户提供Rialto Bridge样品。
Rialto Bridge当然不是计划的终点,接下来才是重头戏。英特尔打算借Falcon Shores项目,将Ponte Vecchio和Sapphire Rapids HBM结合起来。届时,Falcon Shores将同时囊括x86 CPU核心加Xe GPU核心。也正因如此,英特尔决定将Falcon Shores称为“XPU”。
英特尔表示,Falcon Shores将提供比“当前平台”高5倍的每瓦性能、内存容量和内存带宽,我们假定这里说的是英伟达A100以及英特尔、AMD两家的最新服务器CPU。芯片巨头还承诺,Falcon Shores在x86插槽中的计算密度也将达到现有最佳方案的5倍,这里指的可能是AMD的第三代64核Epyc处理器——毕竟英特尔目前在这方面暂时处于落后。
关于Falcon Shores的最大谜团,在于它会采用怎样的x86 CPU核心与Xe GPU核心配置。可能有些变体会只搭载x86核心,有一些则纯使用Xe核心。从这个角度来看,英特尔其实创造出了一种超级灵活的芯片设计,可以同时兼容纯CPU、纯GPU或二者混合,并以“极限带宽”实现内存资源共享。而且与此同时,英特尔也将继续开发较为传统的至强CPU新产品。
Falcon Shores将使用英特尔“埃时代”制程工艺,考虑到2024年推出这个时间节点,预计具体可能会使用20A或18A制程。
为了避免吓跑开发人员,英特尔还承诺推出一种“简化编程模型”,允许开发者自行决定如何将应用程序的不同部分映射至芯片中的x86和Xe核心。
McVeigh还提到,Falcon Shores的混合设计是通过tiles——也就是小芯片——来实现的。如此一来,芯片制造商就能在设计后期拥有更大的芯片配置灵活性。
他补充道,英特尔能够借此调整x86与Xe两种tiles的排列和比例,快速响应市场对于新兴应用的需求。“如果出现新趋势,我们可以快速适应并在设计层面有所体现。”
McVeigh提到,使用tiles来实现灵活设计代表着芯片制造方式中的“革命性”变化。过去几年以来,英特尔曾顺口提到要在多种产品中使用tiles,具体包括Ponte Vecchio、Sapphire Rapids以及即将推出的Meteor Lake等消费级处理器。
尽管英特尔和AMD等公司最近几年来一直在产品中使用小芯片设计,但McVeigh表示小芯片以往的意义更多是在同一芯片的不同部分使用不同的制程工艺。
他强调,“而现在的区别在于,我们可以将不同的tiles放置在相同的区域和接口上,以便随时间推移做出灵活调整。以往,小芯片更多是为了分解架构以简化工艺、提高产量。”
有些朋友可能觉得Falcon Shores的混合CPU-GPU设计听起来耳熟。没错,英伟达也在兼容Arm的Grace CPU上做出了类似的努力。
英伟达计划在Grace Superchip中纳入Grace芯片,其中搭载2个Grace CPU、总计144个核心。这款CPU也将被引入Grace Hopper Superchip,就是在英伟达的下一代Hopper架构中实现Grace CPU与GPU的结合。
而且从目前的情况看,英伟达似乎要比英特尔领先一步。毕竟GPU巨头已经承诺在2023年上半年推出这款Superchip,而英特尔的Falcon Shores则计划在2024年投放市场。
好文章,需要你的鼓励
被盗凭证导致80%的企业数据泄露。随着AI智能体投入生产,管理10万员工的企业将需要处理超过100万个身份。传统身份访问管理架构无法应对智能体AI的大规模部署。领先厂商正采用蓝牙低功耗技术替代硬件令牌,实现基于距离的身份验证。行为分析可实时捕获被入侵的智能体,零信任架构扩展至智能体部署。这代表了自云计算普及以来最重要的安全变革。
ByteDance智能创作实验室发布的Phantom-Data是首个大规模跨情境主体一致性视频生成数据集,包含约100万个身份一致配对样本。该数据集通过创新的三阶段构建管道,从5300万视频和30亿图像中精选高质量跨场景配对,有效解决AI视频生成中的"复制粘贴"问题,显著提升文本遵循能力和视觉质量。
随着AI在各行业中变革企业运营,数据存储面临关键挑战。PEAK:AIO和Solidigm在VB Transform大会上展示了医疗影像AI创新,通过与MONAI开源框架合作,重新定义数据基础设施如何支持医院实时推理和训练。他们的软件定义存储技术结合高性能固态硬盘,能够存储超过200万份全身CT扫描,在空间和功耗受限的边缘环境中实现卓越性能,为临床AI应用提供所需的速度、安全性和可扩展性。
普林斯顿大学研究团队开发了ReasonFlux-PRM,这是首个能深度理解AI复杂思维过程的评分系统。不同于传统只看最终答案的评估方法,新系统能评判AI思考轨迹的每个步骤质量,在数学和科学推理任务上实现了平均4.5%-12.1%的性能提升,为AI教育和训练提供了突破性的解决方案。