Broadcom(博通)砍掉的 Arm服务器处理器项目从坟墓里爬出来,变身成Cavium的64位32核双插槽Armv8-A ThunderX2芯片。
Broadcom在2013年曾宣布正在开发Vulcan,Vulcan是一款3GHz多内核ARM兼容的64位服务器级系统级芯片。到了2016年,这个雄心勃勃的项目被悄悄砍掉。 Broadcom在2015年被Avago收购,Avago对数据中心CPU方面的工作没有兴趣,不到一年后Broadcom的Arm服务器CPU蓝图就被秘密卖给Cavium,Cavium接着将相应的技术重新封装为ThunderX2。
周一全面推出ThunderX2的公告没有提Vulcan。 Cavium当时决定从Broadcom购买芯片组的设计和工程师、注销了Vulcan后在市
场推出ThunderX2,而不是进一步开发旗下的第一代ThunderX,这些或许已经足够说出了新推出的处理器系列的全部内容。原来芯片设计可以从档案了拿过来掸掉灰尘,再以另一种形式投入使用。
说这些不是说ThunderX2不够好。其实ThunderX2似乎是一款相当强大的芯片。笔者只是简单描述了该产品曲折的市场路线。笔者11月、12月期间曾听到过ThunderX2源于Vulcan的传闻,传闻后来也得到两位熟悉ThunderX2开发的消息人士证实。
Cavium数据中心处理器部副总裁Gopal Hegde在一份声明中告诉_记者, “我们充分利用了Vulcan内核,并在片上系统方面做了重大变动,我们利用了从ThunderX学习到的知识提高云用户工作负载的性能,整合了一些Cavium的功能。”
ThunderX2现在已全面上架,用户可以购买含一个或两个处理器的服务器系统。据笔者了解,现在还无法用这些东西自己构建个人电脑或笔记本电脑:只能去找HPE或Cray或友善的白盒服务器制造商。
如果读者想购买一台高端ThunderX2( 32个 2.2GHz内核,总功耗高达180W),每台的价格为1,795美元,前提是一次买1,000台。规格低一些的16个频率为1.6GHz内核(75W功率)机器的价格为800美元。
Cavium在该领域的主要竞争对手是高通(Qualcomm)的64位ARM兼容芯片Centriq 2400:高端型号的48核2.2GHz,功耗达120W,售价1,995美元。两个竞争者之间的竞争非常激烈,时钟频率性能、输入输出带宽和接口、缓存大小等等只是其中的一些比拼数字。
重要的是,ThunderX2是个一插槽或两插槽系统。有必要时也可以使用两个服务器节点。 Centriq则是严格单插槽系统。购买软件许可的方式不同,按内核买、按插槽买、按节点买等等,另外机架密度也是需考虑的因素,最终的插槽组合可能会在成本方面造成各种差异。单插槽可能适合,也可能不适合。每个用户的情况不一样。
值得一提的是,Cloudflare喜欢上了Centriq,还希望将Centriq配置到网络内容分发服务器的仓库里,Cloudflare称高通芯片比自己用的英特尔处理器的功耗要低得多。
微软也说了一些Centriq的好话,还称他们深深地喜欢上了ThunderX2,微软再次提到希望旗下超过一半的数据中心容量(诸如网络搜索、电子邮件、机器学习、存储等等,但不包括客户虚拟机)是由Arm处理器驱动,还称微软希望ThunderX2在这些东西里拥有一席之地。
微软甚至还为Cavium处理器设计了一个主板,以达到Cavium硬件可以融入到定制的Olympus项目的服务器机架里的目的,主板的蓝图已经提交给开放计算项目。
用Arm的原因是什么呢?主要是微软似乎对被绑定到一个指令集架构( 英特尔的ISA)感到厌倦了。众多云组织和企业都在考虑在旗下服务器仓库里塞入Arm及类似的架构,目的是引入第二或第三供应商,进而逃避英特尔在数据中心级芯片的价格和供应渠道方面强大的垄断铁爪,微软是这些云组织和企业的一员。据IDC称,全球数据中心的处理器90%贴了英特尔标识。
Arm服务器所有功能都与服务器应用程序兼容,真是一件令人愉快的事情什么的,但事实上,新贵芯片Arm有些型号的价格比英特尔更便宜而干的事情与英特尔至强不差上下。这才是激起冷血大商家兴趣的真正原因。由此可以推出,任何可以杀价的东西都能激起商家的兴趣。
微软Azure杰出工程师Leendert van Doorn博士表示,”我们将微软Olympus规范ThunderX2主板设计贡献给了开放计算项目,我们期待进一步优化ThunderX2上的内部云服务工作负载。”Doorn博士曾在ThunderX2发布会期间站台,对整个事赞赏有加。
台积电制造的16nm ThunderX2 的CPU内核配有四指令流水线,指令流水线可以不按顺序执行指令,是的,假如要在上面运行来历不明的代码,那就有必要针对Spectre打补丁。
但这些系统不应该运行来历不明的软件或由用户提供的软件。如果攻击者出现在网络搜索引擎的抓取工具箱里以及能够利用Specter从内核或应用程序内存中泄漏数据,那就是说已经遇到更大的问题,搜索引擎的抓取工具箱被人攻陷了。
Cavium的一位发言人告诉我们,“即将来临的ThunderX2确实用到推测性执行,也确实受到Specter变种1和2的威胁,但ThunderX2不受Meltown 变种3的影响。而归根到底,更新了 防范Spectre的Linux补丁和系统固件之后,补丁对性能的影响可以忽略不计。”
每个内核配有一个、两个或四个硬件线程,每个片上系统插槽最多可以配置32个内核。每个内核配有32KB的共享指令和数据一级缓存,256KB的二级缓存以及32MB的分布式三级缓存。 CPU内核的时钟频率可高达2.5GHz, Turbo模式下为3GHz。每个内核还配有两个128位NEON浮点单元,其数学性能大致与Broadwell和Haswell Xeon E5处理器中的AVX2不相上下。
ThunderX2片上系统支持双插槽模式下内存,容量可达4TB,用了8个2.67GHz DDR4控制器,每插槽配有高达16个DIMM。这些DIMM可以是随机存取内存和非易失性内存的混合。 片上系统用了16个PCIe,提供x1、x4、x8和x16的PCIe 3控制器的56个通道。另外还配有通常的SATA3、USB3和通用输入输出接口。名为Cavium相关处理器互连的NUMA相关互连用了600Gbps的管道将内核粘在一起。
笔者的同事对ThunderX2规范研究过一番,还对一些架构做了背景分析。
ThunderX2有多达40种变种产品,可以满足客户的各种需求。Cavium称其处理器与可扩展Skylake Xeons具可比性。
本文截稿时,彭博社的一篇报道称高通正考虑叫停或低价出售Centriq处理器。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。