公司高管承认,好不容易再次建立的服务器芯片领先优势正在缩小
尽管英特尔已经明确将英伟达列为下一代至强Scalable处理器的主要客户,但x86巨头日前承认,服务器芯片的全面出货恐怕要推迟到今年晚些时候。
英特尔数据中心业务负责人Sandra Rivera在周二美国银行证券2022年全球技术大会的小组讨论中,证实了代号为Sapphire Rapids的至强处理器将推迟出货。同一天早些时候,英伟达公司CEO也在会上透露,GPU巨头将在旗舰级DGX H100系统中使用Sapphire Rapids、而非AMD即将推出的Genoa芯片,这与上代系统恰好相反。
英特尔一直在努力宣传Sapphire Rapids这款下一代至强CPU,希望能让自己在过去几年技术落后于AMD的窘境下找回一点排面。事实上,英特尔甚至希望这款新处理器能凭借对DDR5、PCIe Gen 5和Compute Express Link等新技术的率先支持,在市场上全面压制住AMD的下一代Epyc芯片Genoa。
然而,Sapphire Rapids的面世之路并不顺遂。去年6月,英特尔表示将把芯片的量产从2021年第四季度推迟至2022年第一季度,并计划在第二季度增加出货量。结合前几年英特尔迟迟无法成功量产10纳米节点芯片的困境,这一消息再次影响到市场对于芯片巨头的信心。
在本周二的大会上,Rivera表示英特尔目前的计划是“推迟计划,在今年晚些时候”提高Sapphire Rapids的产量。她解释道,造成延迟的主要原因是“新增平台和产品还需要时间来验证”,这也跟之前的10纳米难产对得上。
这位高管还谨慎地指出,出货延后并不是因为Sapphire Rapids的10纳米先进节点有什么问题(英特尔已经于去年将此制程更名为Intel 7,强调此工艺已经能够等同于台积电、三星等代工竞争对手的7纳米制程)。相反,她强调英特尔面向个人电脑和笔记本设备的Alder Lake芯片已经于去年秋季首次亮相,足以证明Intel 7制程并无问题。
Rivera重申了英特尔之前的说法,即Sapphire Rapids在推出后将立即“领先”。但她同时承认,这款CPU的领先周期要比预期更短,毕竟出货延迟意味着有可能跟AMD今年晚些时候推出的Geona芯片撞个正着。换言之,好不容易得来的先发优势很可能变成并驾齐驱。
她表示,“根据最初做出的产品发布及指生产预期,我们本来希望能打出更长的时间差、保持一段时间的领先优势。但由于我们需要进行额外的平台验证,所以这段窗口期有所缩短。Sapphire Rapids仍然领先,只是拉开的差距不及原计划。”
根据最初做出的产品发布及指生产预期,我们本来希望能打出更长的时间差、保持一段时间的领先优势。
尽管出货延后,Rivera仍然强调市场对Sapphire Rapids表现出了“旺盛的需求”。服务器制造商和超大规模服务商已经收到了用于产品验证的芯片样品。但她也坦言,“并非所有客户都愿意转而使用Sapphire”。
英伟达这样的计算密集型企业,当然愿意为了支持DDR5、更高的性能和更优的总体拥有成本而选择最新这代Sapphire Rapids。但Rivera承认2021年初公布的Ice Lake仍拥有“强大的价值与计算能力”,所以继续得到不少客户的青睐。
她指出,“Ice Lake还在继续增长。我们在2021年第四季度创下收入历史纪录,今年第一季度收入和销量双双再创新高。随着今年晚些时候推出Sapphire,Ice Lake应该会在2022年迎来销量峰值,之后有所下降。”
Rivera还重申了英特尔的计划,即在2023年下半年公布Sapphire Rapids的后续芯片Emerald Rapids,并表示后者将“在内存、网络和整体性能方面带来良好提升”,且插槽结构保持不变。
也就是说,Emerald Rapids“对客户来说将是一款易于升级的产品”,也将为他们“基于之前的平台和创新投资获得更大的回报。”
我们认为,AMD公司肯定会在周四直播的金融分析师会议上公布Genoa和未来几代Epyc芯片的更新。在今年5月的更新中,AMD公司芯片设计师已经表示,Genoa有望在今年下半年至年末期间推出。
值得注意的是,AMD还不是英特尔在数据中心CPU领域面临的唯一威胁。目前,亚马逊云科技和Ampere Computing等公司均拿出了号称优于英特尔芯片的Arm架构新处理器,英伟达也计划在2023年上半年推出其首款基于Arm架构的服务器芯片Grace。
Rivera表示,目前Arm芯片在服务器市场的份额还“相当有限”。但她也承认,云服务商对这种有望替代英特尔至强芯片的全新处理器架构抱有浓厚兴趣。正因为如此,x86巨头才决定在2024年推出其使用高效核心设计的Sierra Forest芯片。
“很多云客户并不在意附加功能,而更多关注特定核心类型的工作负载执行效率。他们需要的只是密度更高的吞吐量、单线程性能,而且想要投入大量核心处理某些特定工作内容。”
好文章,需要你的鼓励
清华大学团队突破性开发"零样本量化"技术,让AI模型在不接触真实数据的情况下完成高效压缩,性能反超传统方法1.7%,为隐私保护时代的AI部署开辟新路径。
普林斯顿大学研究团队开发出"LLM经济学家"框架,首次让AI学会为虚拟社会制定税收政策。系统包含基于真实人口数据的工人AI和规划者AI两层,通过自然语言交互找到最优经济政策,甚至能模拟民主投票。实验显示AI制定的税收方案接近理论最优解,为AI参与社会治理提供了新路径。
K Prize是由Databricks和Perplexity联合创始人推出的AI编程挑战赛,首轮比赛结果显示,获胜者巴西工程师Eduardo Rocha de Andrade仅答对7.5%的题目就获得5万美元奖金。该测试基于GitHub真实问题,采用定时提交系统防止针对性训练,与SWE-Bench 75%的最高得分形成鲜明对比。创始人承诺向首个在该测试中得分超过90%的开源模型提供100万美元奖励。
南开大学研究团队提出了一种新的3D高斯泼溅重光照方法,通过在高斯原语上直接编码离散化SDF值,避免了传统方法需要额外SDF网络的问题。该方法设计了投影一致性损失来约束离散SDF样本,并采用球形初始化避免局部最优。实验表明,新方法在保持高质量重光照效果的同时,仅需现有方法20%的显存,显著提升了训练和渲染效率。