前几个礼拜,我们刚刚抱怨英特尔已经很久没发布过关于服务器处理器的任何发展路线图了。但他们不发布,可不代表我们就没有办法。根据猜测、推断、愿望甚至是谣言,我们还是悄悄畅想了一下英特尔未来服务器前端的前进方向。
设计工程师和负责英特尔至强SP处理器的营销人员对我们的胡言乱语一笑置之,因为他们知道这只是一份没什么事实依据的猜想,唯一的目的就是引发大家的讨论、看看能不能摸索出英特尔藏在心里的那份真实路线图。
如今,英特尔在面向华尔街人士的线上投资者日活动中,终于发布了一份官方、正式而且完全真实的至强SP服务器CPU阵容路线图。虽然睽违已久的这份路线图并未透露太多细节,但却引发了两个有趣的重点。为此,我们采访了至强路线图与技术高级研究员兼首席架构师Ronak Singhal。在英特尔,Singhal就像是一座连通客户、营销与芯片设计师的桥梁,负责帮助芯片巨头打造出切实符合市场需求的CPU产品。我们当然希望从他那里能挖出这份路线图背后的更多细节。
第一件新鲜事,就是Intel 3工艺(之前我们一直称之为5纳米工艺)在实验室中进展顺利,所以预期投产时间从2025年提前了一年。换句话说,这项工艺的产品首秀将从原计划中的“Diamond Rapids”至强SP v7处理器正式转为2024年推出的“Granite Rapids”至强SP v6 CPU。
Singhal在采访中告诉我们,“我们正在更新Granite Rapids以支持Intel 3技术,目前Intel 3的研发态势非常顺利,所以我们调整了计划、打算把它用在2024年的至强产品当中。相信大家也能猜到,Granite Rapids也将启用全新的平台,不同于Sapphire Rapids及其继任者Emerald Rapids使用的旧平台。我们还没有公开过关于新平台的具体细节。总之大家敬请期待,Granite Rapids之后还有更多消息要陆续公布。”
说了半天,让我们先看看英特尔官方本次发布的至强服务器芯片路线图:
目前还不清楚Intel 4工艺(我们称之为7纳米工艺的升级版)会何去何从,但可以肯定的是只要英特尔确实打算履行之前承诺的、在2025年之前“实现晶体管单位功耗性能领先”的目标,就必须得尽快推动这场“改朝换代”的更新。否则,芯片巨头的制程工艺将继续落后于AMD和Arm采用的台积电晶体管蚀刻技术。虽然Intel 3同样跟不上这波节奏,但提前一年面世仍然是英特尔在追赶之路上迈出的重要一步。
以上路线图与是英特尔第一次公开承认服务器用“Emerald Rapids”CPU复合体方案的存在。我们猜测这只是Sapphire Rapids的一款升级版本,各个小芯片上将激活更多核心,同时辅以核心调优及其他一些功能。
这么做当然有其道理。借助原有的至强E5与至强SP芯片,英特尔就能“魔改”出三款特殊芯片:在网格上包含10个核心的低核(LCC)版本、网格上包含18个核心的高核(HCC)版本,以及包含28个核心的超核(Extreme Core Count,XCC)版本。我们认为去年发布的“Ice Lake”至强SP v2也将迎来40核心的极核(Ultra Core Count,UCC)版本。其基本布局相当于Sapphire Rapids加10核心计算模块,只是所有模块都布置在同一块整体芯片之上。下面来看:
只要稍稍调整一下UltraPaht互连(UPI)与PCI-Express控制器的位置,再把这块Ice Lake芯片竖向对折再横向对折,得出的结果就高度近似于Sapphire Rapids了,唯一的区别就是使用的核心比较陈旧。据我们所知,英特尔当初就是这么打算的,为的是跟上不断变化的路线图设计。
我们认为,Sapphire Rapids与Emerald Rapids至强SP v4与v5处理器中的小芯片可以拥有18个核心;但在Sapphire Rapids当中,考虑到SuperFIN 10纳米Intel 7工艺的良品率一直没有突破,所以其中最多只会开放14个核心。(换句话说,至少有4个核心会被屏蔽掉。)在Emerald Rapids方面,英特尔会使用精度更高的SuperFIN 10纳米工艺再加上一个新的“Raptor Cove”核心,借此开放16个核心,从而将单插槽核心数量推上64个。(如果真能成功,Emerald Rapids至强理论上甚至能提供72个核心。)
Sapphire Rapids与Emerald Rapids都能接入同一套“Eagle Stream”服务器平台,支持DDR 5内存与PCI-Express外围插槽,如下图所示:
Granite Rapids转向Intel 3工艺后,芯片形状应该也不会出现太大变化,只是每晶体管发热量与成本会随之浮动。我们认为2025年的Diamond Rapids将继续采用经过改进的Intel 3工艺,借此在制程工艺上再抢上一步。毕竟AMD已经拿出了强大的新一代处理器,英伟达和Ampere Computing也凭借Arm服务器芯片加入战团,就连Amazon Web Services也推出了自己的Graviton系列Arm芯片。市场竞争正趋于白热化,英特尔绝不能坐视自己继续成为制程工艺层面的落后者了。
另一个要点:Singhal确认称不会有Sapphire Rapids芯片的高级平台版本,这是因为当初推出的“Cascade Lake”AP-9200平台(将两块完整的Cascade Lake至强接入同一插槽之内)单纯是为了在同等计算密度下提供更高的内存传输带宽。而现在,Sapphire Rapids的HBM变体已经能够实现带宽提升,英特尔自然不必把两块处理器硬塞进同一插槽了。
英特尔至强服务器芯片路线图上还有另一个亮点:在至强SP CPU复合体中使用所谓E-core(强调节能的核心,源自Atom系列处理器)。到目前为止,除了至强Phi“Knights”系列中的多核心产品之外,其他至强处理器采用的都是高性能至强核心,也就是英特尔内部所称的P-core(强调性能的核心)设计。
在占用的空间上,一个P核心可以容纳四个E核心,从这里也能看出使用“Sierra Forrest”至强后单一插槽理论上能够容纳的线程数量。其同样使用Granite Rapids的5纳米制程Intel 3工艺。英特尔并没有说明这款芯片面向哪些场景,但Singhal提到其可能以至强EP系列的名头逐步闯出自己的天地。尽管Sierra Forrest与Ranite Rapids都将使用相同的“Mountain Stream”服务器平台,但用户无法在单一节点内混合使用P核与E核处理器;而且与英特尔的消费级处理器不同,芯片巨头似乎也不打算把P核和E核混搭进小芯片或者同一插槽。如此看来,Granite Rapids与Sierra Forrest处理器将拥有相同的内存通道、I/O以及相同的功率范围,客户则决定在集群中的不同位置具体使用哪一种。当然,二者的插槽可扩展性也未确定,采用P核的至强可支持2到8插槽,而采用E核的至强最大可扩展至2或4插槽。总之,最终方案仍未敲定。
另外,英特尔下一阶段也就只有这两种核心类型了。Singhal解释道,“就目前来看,我觉得这两种已经足以覆盖各种使用范围了。而且我也会担心,如果硬要在P核和E核之间再挤进第三种核心,那么它的定位就会受到P核和E核的挤压和干扰。所以我不会说永远不会有第三种核心,但当下我们只打算专注于这两种核心。”
最后,至强D服务器还没完呢,而且目前仍得到Facebook等超大规模厂商及众多交换机与存储阵列厂商的广泛使用。虽然在路线图上没有体现,但至强D这条产品线也将继续发展。
好文章,需要你的鼓励
11月12日,AMD最新发布的第二代 AMD Versal Premium系列产品,支持CXL内存扩展模块。
梵蒂冈与微软合作,共同推出的圣彼得大教堂数字孪生模型是一个雄心勃勃的项目,希望将古老精神与前沿科技融合起来,旨在保护并与全球观众分享大教堂承载的历史、艺术与精神财富。圣彼得大教堂负责人Mauro Gambetti主教于2024年11月11日在新闻发布会上公布了这一举措,强调了将大教堂打造成“面向所有人开放的空间”的使命,希望借此为2025年即将到来的数百万禧年朝圣者做好准备。
新系统包括NetApp AFF A系列产品组合的新型号,例如NetApp AFF A20、AFF A30和AFF A50全闪存阵列。与该系列的高端型号一样,这些中端全闪存阵列旨在为客户带来了升级的特性,包括亚毫秒级延迟和比上一代阵列高2.5倍的性能。
生成式AI助手Amazon Q正在通过将开发人员的生产力提升到新的高度来改变这家价值1100亿美金的公司。