IBM能否通过Power10重返杀回高性能计算市场?

去年9月IBM出货了代号“Denali”的Power E1080大型系统,近日,IBM宣布对基于代号“Cirrus”Power10处理器的Power Systems产品线进行扩充,新增了入门级和中端系统,其中很多适用于支持高性能计算和人工智能工作负载,以及内存数据库和其他大型工作负载。

去年9月IBM出货了代号“Denali”的Power E1080大型系统,近日,IBM宣布对基于代号“Cirrus”Power10处理器的Power Systems产品线进行扩充,新增了入门级和中端系统,其中很多适用于支持高性能计算和人工智能工作负载,以及内存数据库和其他大型工作负载。

问题是,IBM是否会像过去几十年一样,再次把关注焦点放在高性能计算仿真和建模领域?Power10能否帮助IBM重振高性能计算和AI业务?我们不确定第一个问题的答案,并且在今年2月就这个问题和Power System业务总经理Ken King进行交流的时候,我们明显感觉到高性能计算并不是一个高优先级的事项。不过我们仍然相信,Power10平台的某些特性对于数据分析和其他需要在小型系统上扩展、或者在大型机器上扩展的工作负载来说是具有吸引力的。

今天我们只说5款入门的Power10系统,这些都是单路或者双路、标准2U或者4U的服务器,然后我们将进一步分析Power E1050,一款4路、4U的服务器。我们想要回答的问题很简单:在基本的纯CPU浮点运算方面,Power10处理器能否和英特尔以及AMD的x86服务器芯片相抗衡?

这是一个很重要的问题,因为在高性能计算领域有很多工作负载并没有通过GPU加速,如果IBM能跳出思维定势的话,Power10架构对于这些工作负载来说可能是很有吸引力的,特别是考虑到号称Memory Inception的功能,这实际上是一种跨服务器集群构建内存区域网络的功能。

2年前,IBM在Hot Chip大会上展示了Power10芯片架构,当时我们已经做了详细分析,这里就不再赘述了。可以说,这款芯片可以与2021年4月英特尔推出代号为“Ice Lake”的至强SP处理器以及2021年3月AMD推出代号为“Milan”的Epyc 7003处理器相抗衡。这是有道理的,因为IBM最初计划的是在2021年某个时候(也就是2018年推出Power9芯片的3年后)推出Power10芯片,配置有24个“胖”核心和48个“瘦”核心,采用双芯片模块,以及IBM前代工合作伙伴Globalfoundries的10纳米工艺。但是Globalfoundries没有做到10纳米,并且正式宣布放弃发展7纳米工艺,这让IBM选择了三星,成为三星使用7纳米工艺代工的首个服务器芯片合作伙伴。IBM利用Power10延迟的机会在新的Power10核心中重新实现了Power ISA,然后在其向量单元中添加了一些矩阵数学叠加,使其成为一个很好的AI推理引擎。

IBM还打造了一个更强大的核心,并在SMT8模式下将芯片核心数量降至16个,这种配置是为了实现多线程,每个核心最多有8个处理线程,此外IBM也考虑了SMT4设计,将每个芯片的核心数设置为32个,但目前我们并没有看到,而且IBM没有用 Power10追赶谷歌和其他超大规模厂商,也许我们永远也看不到这种所设计了,但此前的确是在路线图中存在过的。

在入门级服务器方面,IBM将2个Power10芯片放入一个插槽中以增加核心数量,但看起来芯片的良率并没有IBM预期的那么高。最早IBM提及Power10芯片的时候,曾说芯片将有15个或者30个核心,这个数字很奇怪,因为IBM保留了1个SMT8核心或者2个SMT4核心来对冲良率不高的问题。此次IBM推出的新产品,主要是针对现有的AIX Unix和IBM i(也就是以前的OS/400)企业客户,模片上的核心数量要少得多,16个核心中激活了4个、8个、10个或者12个核心。在这些入门级服务器中,Power10核心的性能要比Power9核心高出大约70%,这对很多企业客户来说是一个很大的性能提升,足以应对未来几年工作负载的增长。根据IBM Power产品管理副总裁Steve Sibley的说法,IBM对Power10服务器的收费要比Power9服务器高一些,每一代的改进提升肯定是物有所值的。低端的Power S1014服务器主要针对在IBM i软件堆栈上运行ERP工作负载的中小型企业,性能提升大约是在40%的范围,价格上涨在20%到25%,取决于具体配置。

7月22日发售的这些入门级Power10服务器目前还没有定价,当我们得到更多信息时,将会对性价比进行更详细的分析。

此次推出的6款入门级Power10服务器新品,配置情况如下图所示:

IBM能否通过Power10重返杀回高性能计算市场?

高性能计算客户可能最关注的是Power L1022和Power L1024,因为这两款服务器仅支持运行Linux系统,如果和Power8和Power9系列中的L级系统一样的话,CPU、内存和存储的价格都会更低一些,通过在集群环境中运行Linux与x86更好地展开竞争。这一点尤其重要,因为IBM把Red Hat OpenShift作为一个容器平台,不仅适用于企业工作负载,也适用于那么容器化了的高性能和数据分析工作负载。

关于这些服务器需要注意的一点:IBM正在使用OpenCAPI内存接口,正如此前我们解释过的,该接口将使用“Bluelink”I/O互连作为NUMA链接和加速器附件作为内存控制器。 IBM现在将其称之为Open Memory Interface(OMI),内存通道是x86服务器芯片的2倍,因此有更多来自插槽的带宽资源。OMI内存采用配置了DDR4内存(3.2GHz)的Differential DIMM规格,对于IBM来说,把DDR5内存芯片替换成DDIMM没有什么大不了的,特别是DDR5内存芯片已经过时并且价格也不高。IBM目前在这些服务器中提供32 GB、64 GB和128 GB的内存容量,并将从11月14日开始支持256 GB DDIMM,从上表看这就是你能获得的最大容量。对高性能计算客户来说,重要的是IBM为每个插槽提供了409 GB/秒的内存带宽和每个插槽2 TB的内存。

顺便说一句,这些服务器都采用了NVM-Express闪存驱动器作为存储,没有磁盘,没有闪存SSD。这些服务器还支持PCI-Express 4.0和PCI-Express 5.0插槽,不支持由英特尔发起、IBM支持的CXL协议,不过IBM更倾向于IBM自己的Bluelink OpenCAPI互连,用于将内存和加速器连接到Power计算引擎。

下面是Power10入门级服务器中提供的不同处理器SKU:

IBM能否通过Power10重返杀回高性能计算市场?

我们不知道这些入门级Power10机器中的处理器模块定价是多少,我们猜测24核的版本可能需要多少成本才能与仅基于FP64吞吐量的x86替代品竞争,来估算性能完整的32核Power10 DCM价格可能是多少。

答案是,IBM绝对可以与目前最好的英特尔和AMD竞争,而且IBM有一个非常好的矩阵数学引擎,其他芯片没有。

问题是,英特尔正在开发“Sapphire Rapids”至强SP处理器,估计有4个18核的小芯片,总共72个核心,不过由于英特尔SuperFIN 10纳米(Intel 7)工艺存在良率问题,可能只有其中56个是有效的。AMD也正在开发代号“Genoa”的96核Epyc 7004。Power11还需要几年的时间,所以如果IBM想要重振高性能计算业务,三星必须提高Power10芯片的产量,这样IBM才能在一台服务器中售卖掉更多的核心。现在IBM已经具备了内存容量和内存带宽上的优势。一旦我们获得了更多信息,将会关注L级Power10系统是否可以在价格和性能上与对手竞争。我们还将探讨内存集群如何构建一个非常有趣的、混合了NUMA胖节点和无内存瘦节点的计算平台。

来源:至顶网计算频道

0赞

好文章,需要你的鼓励

2022

07/18

09:16

分享

点赞

邮件订阅