ZDNet至顶网服务器频道 06月09日 评论分析(文/于泽):经过多年打拼,在如今的数据中心领域,英特尔已占据绝对优势。但树大招风,在巨大的蛋糕面前,一定会有很多人试图从中分一杯羹,IBM POWER想,ARM同样想,而这其中各方其实也一直处于一种不断博弈的状态,拼技术、比生态,比如在关键业务领域,POWER、E7一直互为追逐对象,而在数据中心边缘,64位ARM服务器处理器(以下简称64位ARM)则对标凌动系列处理器(请注意,这个时间节点截止到2015年3月)。
为什么会有这么一个时间节点?这就不得不提到至强D系列处理器(以下简称至强D)的发布。在至强D面世之前,更多与64位ARM竞争的是凌动系列处理器(少部分是至强E3系列处理器)。那时候,虽然相比64位ARM,凌动C2000系列处理器(2013年9月发布)不落下风,但也不占太明显优势。如果长此以往,ARM对英特尔的威胁也会越来越大,这也是英特尔发布至强D的一个重要原因。
至强D表现究竟如何?相比64位ARM,其是否有压倒性的优势?下面一起来分析一下。这里需要指出的是,至强D是完整的SoC片上系统,而ARM提供的只是核心架构,严格意义上说,二者并不等同。为了全方位地呈现至强D与64位ARM之间的异同,本文选择AMD皓龙A1100处理器(以下简称A1100)作为64位ARM的代表进行比对。至于为什么选AMD,一方面受限选择范围,毕竟研发生产64位ARM的厂商本来也不多,而像之前名噪一时的ARM服务器芯片厂商Calxeda早已倒闭;另一方面,在数据中心的边缘应用中,AMD还有一点优势,比如低功耗。所以从这个层面来看,A1100其实算是64位ARM中的佼佼者,本文的对比也可以理解为两强之间的对话。
至强D是一款什么样的产品?
虽然在去年的IDF上,英特尔就透露了至强D的一些相关信息,但直到今年3月,才得以真正揭开其神秘面纱。
简单而言,至强D是英特尔首款基于至强系列处理器的SoC产品,其基于Broadwell架构,采用英特尔最新的14nm工艺制程(领先最新的至强E5 v3和至强E7 v3一代),目前只有两款产品面世,分别为4核和8核,每核心平均1.5MB三级缓存(8核心共享12MB三级缓存,四核心减半),支持双通道四插槽DDR4和DDR3L内存,单处理器最大支持128GB内存,TDP(热设计功耗)45W。
至强D架构设计图,这张图很好地解释了为什么至强D是一款SoC产品,其不仅包含CPU,还有很多相应的模块。比如,其支持24个PCIe 3.0通道,8个PCIe 2.0通道,4个USB3.0接口、6个SATA3接口,而且还支持 2个万兆网络接口。
当然,以上信息看起来可能没有多大的感觉,与同类产品相比,甚至差不多。比如,A1100基于64位ARM Cortex-A57架构,同样是SoC式设计,内置四核心或八核心(前者为屏蔽一部分核心而来),每核心平均1MB三级缓存(全部核心共享一体化三级缓存,容量最高8MB),主频不低于2GHz,内存控制器同时支持DDR3和DDR4,最高容量为128GB,制造工艺为GlobalFoundries的28nm工艺。
如果纯分析参数,二者差的可能真没有那么多。但要说至强D最重要的、或者说最强势的一点,还是英特尔TSX(事务同步扩展)指令集的应用。可能你觉得这个词似曾相识?没错,在前些天至强E7 v3的发布会上就讲过这项技术,也正是主要凭借这项新技术,使得E7 v3在SAP HANA的测试中较E7 v2提升达6倍之多。
至强D与凌动C2000、至强E5 v3的主要RAS特性对比。可以看出,在C2000的基础上,至强D新增了很多RAS特性。
除此之外,为了更好地支持更高端的服务器应用和特殊场合对单路SoC系统的可靠性需求,至强D新增了很多RAS特性,比如PCI Express ECRC (End-to-End CRC)就是至强E5 v3甚至都不具备的。
所以总结起来,至强D是英特尔一款介于凌动C2000系列和E3系列(更准确地讲,应该是E5系列)处理器之间的产品,它的定位更加细化,主要面向以动态Web服务、专用托管和Web高速缓存,边缘路由和安全设备,入门级的SAN和NAS存储、温存储等数据中心边缘应用领域。
细心的读者应该还记得在《论“互联网+”时代下的关键业务新常态》一文中对于关键业务外延的论述,就是如今的关键业务已扩展至了从前端(Web端)到后端(数据中心端)的全业务平台,只关注传统关键业务,为其上最好的设备的方式已不可取,用户需要关注业务流程的每个环节。结合前文所讲,不难发现,至强D已经为这种业务需求的变化做好了准备,相比上一代产品,性能、RAS特性等均实现了大幅增强。那至强D相比64位ARM的表现又如何呢?首先我们看看二者在性能层面的表现。
比拼64位ARM,性能如何?
按照惯例,既然是芯片级的较量,我们还是先看看双方在性能方面的比拼。当然,与关键业务对性能的要求不同,数据中心边缘应用并不是一味要求性能高,而是更追求每瓦的性能高低,这是因为数据中心边缘所部署的设备数量要远大于关键业务系统,比如像BAT之类的互联网厂商的Web接入系统的服务器规模一般都在几万台,哪怕节省1%的电量,最终节约的都是一个十分可观的数字。
前文讲过,在至强D发布之前,C2000系列与64位ARM之间就产品层面的较量大致处于犬牙交错的状态,也就是说差不多,何以为证呢?举个例子,根据AMD公布的A1100的SPEC测试成绩显示,8核心(A1100最顶尖产品)的SPECint_rate整数性能大约为80,每核心10,热设计功耗25W。凌动C2750(C2000系列最顶尖产品)的SPECint_rate整数性能是多少呢?根据英特尔官方数据,C2750的该项测试成绩为106,TDP为20瓦。可以看出二者有一定差距,但还不算太大(这里需要指出的是C2750发布时间较早,在2013年9月,A1100是2014年1月发布的,二者差不多属于一代产品)。
AMD皓龙A1100 SPECint_rate整数性能测试成绩
英特尔凌动C2750与上一代产品S1260的SPECint_rate整数性能测试成绩对比
如果说1年多以前,A1100与C2750还勉强算势均力敌的话,那随着至强D的诞生,这一差距明显被拉大了。
根据英特尔公开的资料显示,在动态Web服务的测试中,搭载预生产的1.9GHz、8核心至强D的系统性能是搭载2.4GHz、8核心凌动C2750系统的3.4倍,相较而言有着显著的性能提高,而即便平均到每瓦性能也提升至1.7倍。要知道,最后量产的至强D主频为2.0GHz,显然这一性能提升数值还会更高。粗略计算,至强D的每瓦性能已经是A1100的2倍以上。
以上可以说是至强D与64位ARM比较的第一个层面——性能。不用细追究,至强D的性能也远超过64位ARM。或许有人会质疑,至强D是今年新发布的产品,而A1100去年就发了,相差超过1年,这样的比较并不公平。这其中确实有一点道理,但一方面就如前文所讲,选择A1100实属无奈,其已经算是64位ARM阵营中很新的产品了;另一方面,即便是给其加一代产品,想要实现两倍多的性能提升也并非易事,这也引出了64位ARM与至强D较量的另一个层面。
性能只是冰山一角 生态更重要
“如今IT行业的比拼绝不只是产品之间的较量”,相信这句话大多数人是认同的。产品好只是有了一块好的敲门砖,至于能不能敲开门,还需要一系列配套的“措施”。比如是否有足够多的OEM厂商、操作系统厂商、应用开发商等。
性能方面的较量二者已见分晓,那在上述层面二者之间又是一个什么态势呢?其实也不用多说,ARM的强项在移动端,像智能手机、平板电脑等领域,其占有绝对优势,生态自然也更丰富,但论企业级市场,其进入也不过才几年时间,较英特尔之间的差距要远大于二者在性能层面的差距。
以OEM厂商为例,所有的服务器厂商,包括惠普、戴尔、华为、浪潮、联想、SuperMirco等都是英特尔强有力的合作伙伴。反观ARM,虽然惠普、戴尔、联想等都声称要推出64位ARM服务器,但除了惠普MoonShot登月计划服务器外,其它都迟迟不见动静。是这些厂商不看好这项技术吗?显然不是,那是为什么?因为在没有形成一个完整的生态圈之前,即便生产出来产品也卖不出去,因为产品是要用的,不是摆放在那看的。
同样的道理,对于操作系统层面、应用层面、解决方案层面也都是一样,ARM要想成功不可能一蹴而就,包括英特尔成就今天的局面也是一步步走出来的。这其中ARM还有一个天然的劣势,那就是其只提供核心架构,而不提供成品。换句话说,ARM只管收授权费,但对于下游厂商的支持是十分有限的。在这样的情形下,要想在企业市场推广ARM产品,就需要像惠普这样的厂商去不断的投入、构建生态,换做是你,这样的吸引力有多大呢?要知道想在企业级市场立足的投入是要远高于智能手机、平板电脑等领域的。
总的来说,如果说凌动C2000系列产品时期,英特尔在边缘数据中心领域还处于固守状态的话,那随着至强D的发布,英特尔已全面进入反攻期。与此同时,至强D的面世也意味着英特尔在关键业务新常态下的布局更加全面、强悍。当然,话说回来,究竟鹿死谁手现在下结论还为时尚早。但可以肯定的是英特尔这艘大船一旦开动,ARM面临的将是更加严峻的形势。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。