芯片巨头的2023年及之后发展规划
英特尔本周三更新了新一轮数据中心与AI发展路线图,高管们承诺,困扰其Sapphire Rapids CPU的延误问题已经成为过去。
英特尔数据中心与AI部门负责人Sandra Rivera在投资者电话会议上表示,“我们的第四代至强芯片质量出色且增长强劲,第五代至强也重归可预测正轨,计划在今年第四季度出货。”
然而,这次发布的关键词显然是“健康”。在整个电话会议中,英特尔至强业务副总裁Lisa Spelman在每段演示中,都在强调下一代芯片的“健康”状况。
所谓芯片路线图的健康状况,对英特尔来说自然就是能否如约出货。该公司第四代Sapphire Rapids至强堪称业界笑柄,原本定于2021年推出的产品在长期延误之后直到今年1月才姗姗来迟。
而对英特尔来说,更紧迫的问题是距第一季度财报只剩下数周时间。而且他们也承认,本季度状况可能并不乐观。在英特尔今年1月召开的第四季度财报电话会议上,高管们向投资者发出警告,称下季度(即本季度)收入可能同比缩水达42%。
英特尔2023年初及之后的至强芯片发展路线图
在昨天的电话会议上,英特尔分享了关于其高能效芯片(e-core)系列Sierra Forest至强的消息。该芯片将采用英特尔的Intel 3制程工艺——即第二代7纳米工艺,可将多达144个e-core封装至单一CPU内。
英特尔的e-core已经问世数年,最初于2021年连同Alder Lake台式机芯片一同亮相。但与之前推出过的高性能快速大核心与高效小核心混合构成的产品不同,这次的Sierra Forest全部采用e-core核心。
根据Rivera介绍,经过核心优化的至强可针对超大规模用户青睐的各类高密度计算类应用,借此与亚马逊联手Ampere开发的Arm架构芯片竞争。
尽管Arm芯片近年来在云端获得广泛成功,但英特尔仍有自己的优势在——Sierra Forest为x86架构,其运行方式与其他英特尔CPU完全一致,因此无需重构代码,且在大多数情况下不必担心应用程序兼容性问题。
而英特尔的劣势在于动作太慢,如今才将产品推向市场实在过迟。Sierra Forest定于2024年上半年发布,这还是英特尔能够如约交货的情况下,意味着其比AMD的128核Bergamo都晚了大概一年。Bergamo定于今年上半年发布,面向的是完全相同的细分市场。
英特尔计划在2025年继续迭代Sierra Forest,经过核心优化的这下一代至强产品将命名为Clearwater Forest,这也将是其首款使用18A(相当于1.8纳米)制程工艺的芯片。
但英特尔的支持者们也用不着苦等一年才拿到核心更多的至强处理器。英特尔表示,其Sapphire Rapids的更新版本有望在2023年第四季度推出。
新一代Emerald Rapids是对英特尔现有至强Scalable平台的改进,而且能与上代CPU产品直接兼容。
虽然Rivera没有提供关于该芯片的更多细节,但表示与前代产品相比,该芯片将拥有更多核心和更好的每瓦性能。
“这款芯片的出厂良品率极高,批量难也在进行当中。我们从今天起已经开始向客户提供样品。”
与Sapphire Rapids类似,英特尔的路线图中也提到了Emerald Rapids的后续换代产品。英特尔表示,在Sierra Forest推出后不久,代号为Granite Rapids的下一代性能优化型至强芯片也将问世。很明显,英特尔在新的路线图上还是给自己保留了一点回旋余地。
“与前几代相比,Granite Rapids实现了多项改进,包括更多核心数量、更高的每瓦性能、更快的内存以及IO创新。”
英特尔还通过一段简短的演示强调了最后一点。Spelman在其中展示了一套早期Granite Rapids系统,其配备可达8800MTps的特殊内存DIMM,这样的速度几乎达到当前服务器平台上现代DDR5内存的两倍。
Spelman表示,“这样的带宽提升,对于满足现代CPU快速增长的核心数量和保障充分利用核心资源来说至关重要。”
这其实并不是什么新问题,一直强调以核心数量取胜的AMD对此肯定深有体会。AMD在去年11月发布的Epyc 4处理器上提供96个核心,并将内存通道从8条增加至12条,有效内存带宽提升约50%。
除了英特尔的至强发展路线图外,Rivera还澄清了公司今年早些时候加速计算部门负责人Raja Koduri的离职,以及Rialto Bridge GPU系列被取消后的AI战略。
根据Rivera的说法,英特尔将把Habana Gaudi2加速器定位于AI部署,特别是涉及大语言模型(例如ChatGPT)的部署用例。
与此同时,英特尔的GPU Max系列(原名Ponte Vecchio)则更多面向高性能计算类应用。这款芯片也是阿贡国家实验室正在开发、但拖延已久的Aurora超级计算机的指定核心,但现已被代号为Falcon Shores XPU的CPU-GPU组合芯片取代。然而,这款XPU芯片要到2025年内才能实际推出,仍远远晚于市场定位相近的AMD MI300 APU。
最后,对于体量较小的AI推理类工作负载(英特尔的定义是参数在100亿个以下),那么嵌入Sapphire Rapids至强芯片的AMX加速器就完全可以胜任。
英特尔最后强调,这些名称未来仍有可能更改。各芯片将共享同一通用软件接口,工作负载可在其中任何一种架构上随意部署。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。