x86巨头公布高性能计算(HPC)技术路线图,Ponte Vecchio继任者首度亮相
除了即将登陆全球最强超级计算机、已经拥有几年历史的Ponte Vecchio GPU之外,英特尔终于带来了关于更多高性能计算芯片的细节消息。其中一大亮点,就是将CPU与GPU整合在同一封装之内。
半导体巨头周二在德国汉堡举行的国际超级计算大会上,分享了其以HPC为重点的最新产品路线图。
因为正潜心开发至强Scalable CPU方案,英特尔此次只为HPC应用带来一组独立产品,而这重要的第一枪正是为即将推出的Sapphire Rapids芯片提供高带宽内存(HBM)变体。这款芯片将配备最高64 GB的HBM2e内存,由此将超大规模数据集的快速访问变成可能。
英特尔新兴HPC产品组合的另一大驱动要素,则是其数据中心GPU。这款高性能GPU将基于风头正劲的Ponte Vecchio芯片,也就是英特尔拿来与英伟达A100和AMD Instinct MI200正面竞争的方案。它将使用最高128 GB的HBM2e内存,可从容处理HPC与AI混合工作负载。
英特尔承诺通过Rialto Bridge,在Ponte Vecchio的性能之上再进一步。
为了从Rialto Bridge身上压榨出更多性能,英特尔计划为它搭配一个功率800瓦的模块,并在模块中采用液冷方案。英特尔还将把Rialto Bridge安装到Facebook母公司Meta以及微软等超大规模厂商的OAM 2.0形制设备当中。
而且已经熟悉Ponte Vecchio的开发者,在为Rialto Bridge准备应用软件时也不会遇上什么麻烦。英特尔明确承诺“软件一致性”,表示预计将在2023年年中开始为客户提供Rialto Bridge样品。
Rialto Bridge当然不是计划的终点,接下来才是重头戏。英特尔打算借Falcon Shores项目,将Ponte Vecchio和Sapphire Rapids HBM结合起来。届时,Falcon Shores将同时囊括x86 CPU核心加Xe GPU核心。也正因如此,英特尔决定将Falcon Shores称为“XPU”。
英特尔表示,Falcon Shores将提供比“当前平台”高5倍的每瓦性能、内存容量和内存带宽,我们假定这里说的是英伟达A100以及英特尔、AMD两家的最新服务器CPU。芯片巨头还承诺,Falcon Shores在x86插槽中的计算密度也将达到现有最佳方案的5倍,这里指的可能是AMD的第三代64核Epyc处理器——毕竟英特尔目前在这方面暂时处于落后。
关于Falcon Shores的最大谜团,在于它会采用怎样的x86 CPU核心与Xe GPU核心配置。可能有些变体会只搭载x86核心,有一些则纯使用Xe核心。从这个角度来看,英特尔其实创造出了一种超级灵活的芯片设计,可以同时兼容纯CPU、纯GPU或二者混合,并以“极限带宽”实现内存资源共享。而且与此同时,英特尔也将继续开发较为传统的至强CPU新产品。
Falcon Shores将使用英特尔“埃时代”制程工艺,考虑到2024年推出这个时间节点,预计具体可能会使用20A或18A制程。
为了避免吓跑开发人员,英特尔还承诺推出一种“简化编程模型”,允许开发者自行决定如何将应用程序的不同部分映射至芯片中的x86和Xe核心。
McVeigh还提到,Falcon Shores的混合设计是通过tiles——也就是小芯片——来实现的。如此一来,芯片制造商就能在设计后期拥有更大的芯片配置灵活性。
他补充道,英特尔能够借此调整x86与Xe两种tiles的排列和比例,快速响应市场对于新兴应用的需求。“如果出现新趋势,我们可以快速适应并在设计层面有所体现。”
McVeigh提到,使用tiles来实现灵活设计代表着芯片制造方式中的“革命性”变化。过去几年以来,英特尔曾顺口提到要在多种产品中使用tiles,具体包括Ponte Vecchio、Sapphire Rapids以及即将推出的Meteor Lake等消费级处理器。
尽管英特尔和AMD等公司最近几年来一直在产品中使用小芯片设计,但McVeigh表示小芯片以往的意义更多是在同一芯片的不同部分使用不同的制程工艺。
他强调,“而现在的区别在于,我们可以将不同的tiles放置在相同的区域和接口上,以便随时间推移做出灵活调整。以往,小芯片更多是为了分解架构以简化工艺、提高产量。”
有些朋友可能觉得Falcon Shores的混合CPU-GPU设计听起来耳熟。没错,英伟达也在兼容Arm的Grace CPU上做出了类似的努力。
英伟达计划在Grace Superchip中纳入Grace芯片,其中搭载2个Grace CPU、总计144个核心。这款CPU也将被引入Grace Hopper Superchip,就是在英伟达的下一代Hopper架构中实现Grace CPU与GPU的结合。
而且从目前的情况看,英伟达似乎要比英特尔领先一步。毕竟GPU巨头已经承诺在2023年上半年推出这款Superchip,而英特尔的Falcon Shores则计划在2024年投放市场。
好文章,需要你的鼓励
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
北卡罗来纳大学研究团队通过深入分析手指触控过程中的动态特征,开发出新型触控识别算法,能够理解触控过程中的压力分布、接触面积变化等信息,比传统方法准确率提高15-28%。该技术采用分层处理架构解决计算效率问题,已在真实设备上验证效果,将为个性化交互、情感感知等未来应用奠定基础,有望显著改善用户的触控体验。
据报道,OpenAI正准备发布一款由即将推出的Sora 2视频模型驱动的独立社交应用。该应用与TikTok高度相似,采用垂直视频信息流和滑动滚动导航。不过,该应用仅支持AI生成的内容,用户无法从手机相册上传照片或视频。Sora 2在应用内生成的视频时长限制为10秒或更短。应用还包含身份验证工具,允许用户使用自己的肖像生成视频,其他用户可以标记并在重新混合视频时使用他们的肖像。
Perfios公司研究团队开发了创新的AI理财顾问训练框架,通过行为心理学驱动的数据生成方法,让8B参数的小模型在个人理财建议方面达到了与32B大模型相当的性能,同时运营成本降低80%。该方法首次将用户心理状态分析作为独立训练阶段,显著提升了AI建议的个性化程度和人性化表达,为普及化AI理财服务提供了技术路径。