芯片巨头的2023年及之后发展规划
英特尔本周三更新了新一轮数据中心与AI发展路线图,高管们承诺,困扰其Sapphire Rapids CPU的延误问题已经成为过去。
英特尔数据中心与AI部门负责人Sandra Rivera在投资者电话会议上表示,“我们的第四代至强芯片质量出色且增长强劲,第五代至强也重归可预测正轨,计划在今年第四季度出货。”
然而,这次发布的关键词显然是“健康”。在整个电话会议中,英特尔至强业务副总裁Lisa Spelman在每段演示中,都在强调下一代芯片的“健康”状况。
所谓芯片路线图的健康状况,对英特尔来说自然就是能否如约出货。该公司第四代Sapphire Rapids至强堪称业界笑柄,原本定于2021年推出的产品在长期延误之后直到今年1月才姗姗来迟。
而对英特尔来说,更紧迫的问题是距第一季度财报只剩下数周时间。而且他们也承认,本季度状况可能并不乐观。在英特尔今年1月召开的第四季度财报电话会议上,高管们向投资者发出警告,称下季度(即本季度)收入可能同比缩水达42%。
英特尔2023年初及之后的至强芯片发展路线图
在昨天的电话会议上,英特尔分享了关于其高能效芯片(e-core)系列Sierra Forest至强的消息。该芯片将采用英特尔的Intel 3制程工艺——即第二代7纳米工艺,可将多达144个e-core封装至单一CPU内。
英特尔的e-core已经问世数年,最初于2021年连同Alder Lake台式机芯片一同亮相。但与之前推出过的高性能快速大核心与高效小核心混合构成的产品不同,这次的Sierra Forest全部采用e-core核心。
根据Rivera介绍,经过核心优化的至强可针对超大规模用户青睐的各类高密度计算类应用,借此与亚马逊联手Ampere开发的Arm架构芯片竞争。
尽管Arm芯片近年来在云端获得广泛成功,但英特尔仍有自己的优势在——Sierra Forest为x86架构,其运行方式与其他英特尔CPU完全一致,因此无需重构代码,且在大多数情况下不必担心应用程序兼容性问题。
而英特尔的劣势在于动作太慢,如今才将产品推向市场实在过迟。Sierra Forest定于2024年上半年发布,这还是英特尔能够如约交货的情况下,意味着其比AMD的128核Bergamo都晚了大概一年。Bergamo定于今年上半年发布,面向的是完全相同的细分市场。
英特尔计划在2025年继续迭代Sierra Forest,经过核心优化的这下一代至强产品将命名为Clearwater Forest,这也将是其首款使用18A(相当于1.8纳米)制程工艺的芯片。
但英特尔的支持者们也用不着苦等一年才拿到核心更多的至强处理器。英特尔表示,其Sapphire Rapids的更新版本有望在2023年第四季度推出。
新一代Emerald Rapids是对英特尔现有至强Scalable平台的改进,而且能与上代CPU产品直接兼容。
虽然Rivera没有提供关于该芯片的更多细节,但表示与前代产品相比,该芯片将拥有更多核心和更好的每瓦性能。
“这款芯片的出厂良品率极高,批量难也在进行当中。我们从今天起已经开始向客户提供样品。”
与Sapphire Rapids类似,英特尔的路线图中也提到了Emerald Rapids的后续换代产品。英特尔表示,在Sierra Forest推出后不久,代号为Granite Rapids的下一代性能优化型至强芯片也将问世。很明显,英特尔在新的路线图上还是给自己保留了一点回旋余地。
“与前几代相比,Granite Rapids实现了多项改进,包括更多核心数量、更高的每瓦性能、更快的内存以及IO创新。”
英特尔还通过一段简短的演示强调了最后一点。Spelman在其中展示了一套早期Granite Rapids系统,其配备可达8800MTps的特殊内存DIMM,这样的速度几乎达到当前服务器平台上现代DDR5内存的两倍。
Spelman表示,“这样的带宽提升,对于满足现代CPU快速增长的核心数量和保障充分利用核心资源来说至关重要。”
这其实并不是什么新问题,一直强调以核心数量取胜的AMD对此肯定深有体会。AMD在去年11月发布的Epyc 4处理器上提供96个核心,并将内存通道从8条增加至12条,有效内存带宽提升约50%。
除了英特尔的至强发展路线图外,Rivera还澄清了公司今年早些时候加速计算部门负责人Raja Koduri的离职,以及Rialto Bridge GPU系列被取消后的AI战略。
根据Rivera的说法,英特尔将把Habana Gaudi2加速器定位于AI部署,特别是涉及大语言模型(例如ChatGPT)的部署用例。
与此同时,英特尔的GPU Max系列(原名Ponte Vecchio)则更多面向高性能计算类应用。这款芯片也是阿贡国家实验室正在开发、但拖延已久的Aurora超级计算机的指定核心,但现已被代号为Falcon Shores XPU的CPU-GPU组合芯片取代。然而,这款XPU芯片要到2025年内才能实际推出,仍远远晚于市场定位相近的AMD MI300 APU。
最后,对于体量较小的AI推理类工作负载(英特尔的定义是参数在100亿个以下),那么嵌入Sapphire Rapids至强芯片的AMX加速器就完全可以胜任。
英特尔最后强调,这些名称未来仍有可能更改。各芯片将共享同一通用软件接口,工作负载可在其中任何一种架构上随意部署。
好文章,需要你的鼓励
能源初创公司联邦聚变系统宣布与谷歌DeepMind合作,利用AI技术优化其即将建成的Sparc反应堆运行。双方将使用DeepMind的Torax软件模拟反应堆内等离子体,并结合AI模型帮助实现聚变发电。聚变发电有望提供零排放的大量电力,AI公司看好聚变作为数据中心电源。谷歌此前已投资多家聚变公司,并计划从CFS首个商业电站采购200兆瓦电力。
上海AI实验室联合多家顶尖机构开发出全球首个科学推理大模型SciReasoner,该模型在2060亿科学数据上训练,支持103个科学任务,能够像科学家一样进行逻辑推理并展示思考过程。它实现了化学、生物学、材料科学等多领域知识整合,在分子设计、性质预测、文献分析等方面表现出色,为科学研究提供了强大的AI助手工具。
Omdia最新研究显示,以AWS、微软和谷歌云为首的超大规模云市场企业软件销售额预计将从2024年的300亿美元激增至2030年的1630亿美元。这一增长反映了企业对市场采购模式的日益采用和智能AI销售的急剧上升。2025-2030年复合年增长率预计达29.1%。基础设施软件、DevOps和商业应用将占总支出的63%,而智能AI和网络安全成为高增长领域。
南洋理工大学研究团队开发出SHINE方法,这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能,能够在复杂光影条件下完美合成图像,包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集,验证了SHINE在各种挑战性场景中的卓越性能,为图像编辑技术的发展开辟了新方向。