扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
我们在今年年初的时候曾经制作过一个专题来分析今年企业级x86处理器的市场竞争态势(详见《英特尔与AMD:企业计算之两虎相争2010》,如今第一季度已过双方的主流选手都已悉数登场亮相,而相关的评测数据也相继公布,由此我们可以重新来去审视这场竞争,而且不再只是猜测。
为什么说是“生死较量”?这里更多的是指向AMD所面临的处境,在早前笔者的专文《论AMD在企业应用市场上的“失守”》中,就已经提到了AMD在企业级市场上所面临的严峻挑战。想当年,在2005年第四季度,AMD的CPU市场占有率达到了21.4%,而到了2010年年初这一比例下降到了10%左右。但如果只看企业级市场则明显要更低,现在能保持10%左右的市占率在很大程度上利益于桌面端处理器的高性价比的推广策略。根据不完全统计,在中国双路服务器市场上,AMD皓龙(Opteron)平台的市占率已经少于5%,这显然已经是一个非常严酷的问题。自2009年,英特尔推出革命性Nehalem架构而将AMD传统的优势消除之后,从“上海”到“伊斯坦布尔”均远不是至强5500的对手,但由于在2009年英特尔还没有将Nehalem架构引入到多路平台市场,所以AMD的皓龙8xxx系列产品仍然能享有较好的市场份额,不过到了2010年,当Nehalem架构全面在双路与多路平台市场上渗透后,AMD在多路平台上的优势也将受到极大的冲击。笔者甚至认为,2010年的竞争结果很可能将会决定AMD皓龙产品家庭的未来命运,所以用“生死较量”来形容AMD在2010年企业级市场上的生存态势并不为过。
好在AMD在伊斯坦布尔之后在产品上大大的弥补了规格上的软肋,虽然处理核心的架构并没有多少变化,但外围架构(如内存与I/O)规格的升级在很大程度上也拉近了与对手的距离。2010年第一个出场的皓龙6100系列(Opteron 6100,代号马尼-库尔),是AMD在2010年里最为重要的产品,这是因为从市场布局来看,6100系列肩负着中高端双路与4路服务器两大市场,面向低端双路的皓龙4100系列将在第二季度末推出。而反观英特尔方面,第一季度就已经将两大产品线出齐,分别是面向主流双路的至强5500的接班人Westmere-EP(至强5600),和面向高端双路与多路服务器的Nehalem-EX系列(至强7500/6500),可谓阵容完整。下面我们就来看看这三大产品线的基本对阵与产品规格。
皓龙6100、至强7500与至强5600产品规格对比
我们可以看出皓龙6100相较于以往的伊斯坦布尔有了很大的进步,尤其是DDR3-1333内存与6.4GT/s速率的HT总线(伊斯坦布尔分别是DDR2-800和4.8GT/s)的加盟,以及最高12核心的设计,让皓龙6100至少已经在规格上基本不处劣势。而至强5600与至强7500则与Nehalem-EP一脉相承,稳扎稳打,也充分体现出了Nehalem架构模块化设计的优势,极大加强了英特尔在多路平台上的实力,由于AMD在2010年的8路及以上市场上没有新品推出,所以这个市场上基本上就是Nehalem-EX的独角戏(AMD的伊斯坦布尔84xx系列虽然还会出货,但在性能上肯定不可比拟,只能靠价格吸引买家了)。下面我们再来看看双方具体的出场阵容,而有关这三大家族的详情请见本站的相关专题(皓龙6100专题、至强7500专题、至强5600专题)。
(点击放大)
在2010年主流中高端双路与4路市场上,将呈现皓龙6100以一敌二的局面。总体上,将有8款至强7500、3款至强6500、12款至强5600,共23款至强家族处理器与10款皓龙6100处理器展开竞争,从产品数量上至强家族占据了绝对优势,不过以核心数量来划分,12核心的由皓龙6100独占5款,8核心方面至强4款,皓龙6100则有5款,6核心方面至强有10款,4核心方面至强则有9款,所以若以核心数量来看在中高端区域皓龙6100占优,至强家族的火力则集中在了中端,但是核心数量并不能代表最终的性能等级,2009年的4核心至强5500力压6核心的伊斯坦布尔就是很好的例证,关键还要看数据说话。那么皓龙6100面对两大至强高手,又会有怎样的表现呢?接下来就让我们通过一系列的测试对比来预测这场生死较量的走向吧。
下文中的评测数据取自英特尔与AMD的官方发布,以及国外权威媒体的评测,经笔者整理汇,谨供大家参考。
整数与浮点性能需要指出的是,这里的整数与浮点运算性能对比采集的是峰值性能,而不是base性能,所以请大家注意分辨。
双插槽平台整数运算性能
在整数运算性能方面,8核心的至强X7650以微弱的优势占用12核心的皓龙6174,而6核心的至强X5680虽然成绩不如6174,但差距也很小,至于8核心的皓龙6136则不及两个对手,整数性能只有6核心至强X5680的76%。由此可以看出在核心效率上AMD仍然处于劣势,好在及时推出了12核心的产品,方才稳住阵脚,但仍然没有打破英特尔在整数运算方面的优势。
双插槽平台浮点运算性能
在浮点运算性能方面,得益于12核心的设计,虽然主频较低但皓龙6174仍然取得了第一,比至强X7560高出了10.6%,不过按理论值估算(105.6GFLOPS对72.32GFLOPS)应该是46%的增幅,由此也可以看出6174的内存与I/O带宽平均到每个核心上并不让人满意。而8核心的皓龙6136则不及8核心的至强X7560但稍稍领先于至强X5680,领先幅度为0.7%,这与其理论的浮点性能的差距也比较大(83.2GFLOPS对79.92GFLOPS),两者的每核心平均内存带宽也基本相当,但I/O带宽上,皓龙6136则占优,不过就核心处理性能来看,皓龙仍需努力。
4插槽平台整数运算性能
在4插槽平台的评测中,我们将至强5600换掉,以AMD上一代的伊斯坦布尔8400系列替代,此时X7650仍然取得第一的成绩,而且较双插槽时进一步扩大了领先优势,比4插槽皓龙6174性能高出了1.4%,这应该与至强X7560在扩展效率上更高有关(内存带宽与I/O带宽扩展)。
4插槽平台整数运算性能
在浮点运算方面,可以看出皓龙6100系列进步明显。以8核心的6136为例,与同主频的8435相比,核心多了两个,理论浮点性能增加了33%,但实际上则增长了近86%,这显然与内存和I/O带宽的增加有关(6136的每核心内存带宽是5.33GB/s,8435只有2.13GB/s),而12核心的6174则比至强X7560领先了9.28%,也比双插槽时的领先幅度要低,原因仍然与平台扩展效率有关。
综合来看,皓龙6100这次在整数性能方面追近对手很多,12核心的6174稍稍落后于X7560,但也稍稍领先于X5680,而在浮点性能方面仍然保持着良好的发展势头。不过,皓龙仍然存在着核心效率不高的问题,而且由于6100处理器在内部架构上采用了HT总线的级联两个6核心DIE的设计,所以平台的扩展效率受到了一定的约束。至于8核心的皓龙6100,则在双路平台上保持着对X5680很微弱的浮点性能的优势,在其他方面则不是7500与5600的对手。
Java、ERP、OLTP与数据库性能商用Java性能对比测试
SPEC Java Business Benchmark 2005是一款用Java编写的多线程测试工具,它的评测是模拟一个企业基于若干个仓库为多个客户提供交易服务的环境,以每秒的操作数(BOPS,Business Operations per Second)来评估性能。
皓龙6100的成绩是笔者推测的结果,因为这个测试主要与整数运算性能有较大的关系,但在AMD公布的性能基准测试结果中,4插槽的8435的整数性能要比两插槽的6174(相当于4颗6核心的处理器)高,所以在SPEC jbb2005的测试中,6174的性能也将在4插槽的8435之下。笔者认为这仍然是与6174两个6核心DIE之间的互联效率较低有很大关系。6100内的两个DIE之间是靠一个16x和一个8x的HT总线相连(相当于双向连接并不对等,其中一路16x链路被分为两个8x链路,一个用于CPU内两个DIE的连接,另一个8x要负责对外连接),因此往往会受制于8x HT总线的带宽,按6.4GT/s的速率,也就是6.4GB/s的带宽,而8435处理器与另一颗处理器的单向连接带宽为9.6GB/s,所以6174内部互联效率往往更低。所以,我按两者的整数性能的差距推算出了皓龙6174的Java测试性能。
双插槽至强X7560的成绩是通过英特尔公布的与至强X5680的比值推算出来的,虽然至强X7560在单纯的整数运算中败给了皓龙6174,而借助于出色的整体I/O设计,在这一测试中夺得第一名。而至强X5680也领先于皓龙6174,体现出了强大性能。不过6174仍然要比至强5500平台强不少,不过其核心数量也整整是至强5500的4倍。
企业ERP应用SAP-SD 2-Tier测试结果
基于SAP-SD 2-Tier的测试结果中,至强X7560与皓龙6174也是通过相关的数据推算出来的(英特尔宣称4插槽的至强X7650的SAP-SD 2-Tier性能是至强X5680系统的2.12倍),结果与Java商用性能的表现基本一致,至强X7560最高,至强X5680其次,皓龙6174则领先于至强X5570,但落后于4插槽的8435。
Oracle Calling Circle测试成绩
Oracle Calling Circle是一个OLTP基准测试程序,Anandtech网站采用了一个9GB大小的数据库进行在线交易处理(OLTP,OnLine Transaction Processing)性能测试,测试中将磁盘队列长度限定为1,以增加CPU的负载,并考验内存的效率。结果显示,由于要为HT Assist功能预留出2MB的空间,以用于多CPU间的轮询过滤。所以实际上皓龙6100处理器可用的3级缓存容量只有10MB,所以在这项测试中的确有些吃亏,双CPU还不如单颗至强X5670性能强。不过Anandtech网站也声明,该测试的数据容量较小,可能并不适用于16核心以上平台(双插槽的皓龙6100为24核心)。
vApus +实时 "Nieuws.be"网站数据库测试(皓龙6174平台为32GB DDR3-1333内存,至强X5670平台为24GB DDR3-1333内存)
Anandtech网站采用自己开发的vApus测试软件,配合Web 2.0网站Nieuws.be的容量达100GB的SQL数据库进行在实时在线性能测试,网络的流量从6.5MB/s到峰值14MB/s不等。硬盘的队列长度为0以杜绝磁盘性能的影响。结果表明,皓龙6174性能得到了明显提升,这应该也与数据传输主要经过网络而大大降低了内存与缓存的瓶颈效应有关。
服务器虚拟化性能VMmark虚拟化性能测试结果
VMware的VMmark测试程序以节片(Tile)为负载单位,一个节片内含6个工作负载,等效为6个虚拟机,VMware用这6个虚拟机分别模拟常见的应用,它们分别是Web服务器、文件服务器、邮件服务器、数据库服务器、Java服务器以及一个空闲的虚拟机。这6个虚拟机同时工作,VMmark测试总体的应用水平,分值越大代表虚拟化性能越高。VMwark的原理在于,只要服务器的性能有节余就增加节片,如果此时节片内的虚拟机性能没有降低,总体性能得分就会提高,但如果增加节片后,虚拟机性能下降,那总体得分也就下降,所以VMmark就截取最高分,即服务器虚拟化的最大极限,并注明此时的节片数量。
本次测试成绩中,至强X7560的成绩是根据英特尔公布的其相对于至强X5680的提高比值推算出来的(英特尔宣称4插槽的至强X7560的VMmark成绩是X5680的2.01倍)。从结果上看,仍然是X7560第一,X5680其次,它们都比4插槽的皓龙8439SE还要高,当然双插槽的皓龙6174肯定不如4插槽的8439SE,但已经超过了至强X5570。而从总体上看,至强X7560与X3680这兄弟俩的领先幅度是非常明显的,关键在于皓龙6174在虚拟机支持的数量上与8439SE和至强X5570没有提高,都是102个,可至强X7560与X3680已经达到了156个,在这点上它是皓龙6174虚拟化性能的近1.5倍。
Anandtech网站采用自己的vAPUS+VMware ESX 4平台的8虚拟机性能评测(皓龙6174平台为32GB DDR3-1333内存,至强X5670平台为24GB DDR3-1333内存)
Anandtech网站采用自己的vAPUS+微软Hyper-V平台的8虚拟机性能评测(皓龙6174平台为32GB DDR3-1333内存,至强X5670平台为24GB DDR3-1333内存)
Anandtech网站的虚拟化性能测试结果与VMmark的结果相当。Anandtech网站采用自己的vAPUS软件进行测试,测试时它建立两个节片,每个节片运行4个虚拟机,分别是一个SQL 2008 64bit版+Windows 2008 64-bit系统,采用vApus进行负载测试(占用4个虚拟CPU);两个重负载的MCS eFMS门户在Windows 2003 R2上运行PHP与IIS, 采用vApus进行负载测试(每个占用2个虚拟CPU);一个OLTP数据库,基于Oracle 10G Calling Circle基准测试(占用4个虚拟CPU)。总共有8个虚拟机,共24个虚拟CPU,分别运行在VMware的ESX平台和微软的Hyper-V平台。结果可以看出来,至强X5670的虚拟化性能的确比皓龙6174高,而后者也不如自家的4插槽伊斯坦布尔8435。
总结一下,就评测成绩来看,至强7500与至强5600不分伯仲,但由于至强7500/6500在内存扩展能力方面更强,所以它是目前最为强大的x86虚拟化平台,皓龙6174虽然在虚拟化性能上不如这两者,不过已经超越了至强5500系列,较以往的AMD双路平台更是进步明显。再加上其价格水平比至强X5680更低,但比X5680的内存扩展能力更强(6174平台可扩展至24个DIMM,以8GB/DIMM容量计算,合192GB,后者则是18DIMM/144GB),所以还是具备很强的竞争实力。
高性能计算单结点ANSYS FLUENT 12.1测试中的Fluent Truck_14 m子项成绩
NSYS FLUENT 12.1提供了一组模拟流体计算的基准测试软件,通过6个不同的基准测试来评价系统在流体计算应用的性能表现,Fluent Truck_14 m是其中的一项,从成绩上看,皓龙6174保持了自己在浮点性能上的优势,但8核心的6136不敌6核心的至强X5670,但强于至强X5570。另外,根据英特尔给出的至强X7560较至强X5680的HPC性能提升比例为10%左右计算,可以分析出至强X7560在这一项的测试中的成绩应该略好于皓龙6174,估计成绩在105左右。需要指出的是,双插槽的AMD伊斯坦布尔2435(2.6GHz)的这一测试成绩为52.1,可见新一代的皓龙6100系列进步非常明显。
单节点LS DYNA单车障碍物碰撞模拟计算成绩
LS-DYNA是一个通用的是世界上最著名的瞬变动力有限元分析程序,能够模拟真实世界的各种复杂问题,可用多种行业,包括汽车设计、航空航天、制造业以及生物工程。而汽车碰撞模拟就是其典型的应用之一,上图就是单车障碍物碰撞模拟计算(单节点)的成绩。其中,至强X5670的成绩是根据英特尔宣布的至强5600较至强5500在这一测试中的提高比例推算出来的。结果上,皓龙6174再次取得了第一,但与至强X5670的成绩很接近。8核心的皓龙6136仍然不及至强X5670,但已经超过了至强X5570。至于至强X7560,以英特尔公布的提升比例来看(4插槽的X7560的双车碰撞演算性能是双插槽的X5680的2.1倍),预计会比皓龙6174稍强,不过估计优势很微弱。顺便一提,双插槽的伊斯坦布尔2435(2.6GHz)的这一测试成绩为84.7。
综合来看,皓龙6100系列在高性能计算领域拥有很强的实力,它在价格上比至强7500要低很多,而在浮点运算性能和内存扩展能力上又比双插槽的至强5600更强,所以在市场竞争中处在一个不错的位置上,较上一代的伊斯坦布尔有了明显的改进。
总结:皓龙家族迎来新的曙光 至强家族迎来新的挑战由于在此之前,我们已经详细介绍过至强5600与至强7500家族的性能表现(至强5600性能分析;至强7500/6500性能分析),所以在这里我想多说一说对AMD皓龙6100的看法。
在2009年6月份,AMD推出其首款6核心皓龙处理器伊斯坦布尔(Opteron 24xx/84xx系列)之时,笔者看着它与至强5500的性能对比,真的是有种很“英勇”很“悲壮”的感觉。不过,到了今天当我们看到新的一代皓龙6100的表现时,我感觉当初在《英特尔与AMD:企业计算之两虎相争2010》一文所做的预测基本得到了应验——皓龙家族终于可以在很多应用上与至强家族争夺话语权了。从总体上讲,借助于内存与I/O规格的提升,皓龙6100在性能上有了很大的提高,我们很清楚的看到在一些应用领域的性能表现上,至强家族相对于皓龙的竞争态势,已经从绝对领先慢慢开始向互有胜负的胶着状态演变,这对于英特尔来说可能并不愿意看到,但对于市场和客户来讲无疑是个好消息,因为它真正为市场和客户提供了另一个实打实的选择。
但是,我们也不能不看到在这背后AMD所付出的代价,那就是以更多的核心数量来换取性能上的提升。事实上,你可以把双插槽的皓龙6174服务器(2.2GHz,24核心)变相看作是一台比4插槽的伊斯坦布尔8435(2.6GHz,24核心)稍弱的服务器,而用一台4插槽的服务器与一台两插槽的至强7500/5600服务器抗衡还互有胜负,你又会有何感想呢?
对于AMD首先推出12核心处理器,不由得让我想到了AMD在GPU市场与NVIDIA的竞争战略,AMD的GPU也是以核心数量众多而出名,论单个核心的性能,它并不如NVIDIA,但通过快速的累加核心数量,而取得了性能上的优势,这一点在其HD4xxx与HD5xxx系列方面体现得非常明显。回到皓龙6100身上我们似乎也能看到这种思路。在上面的那些漂亮的性能成绩的后面,我们不要忘了它与对手的核心数量的差别,皓龙6174是至强X7560核心数量的1.5倍,是至强X5680的两倍,可在性能上还互有胜负,因此反过来,我们也可以认为AMD在核心效率上是对手的1/2(X7560的内存带宽并没有成倍于至强X5680的提高),我想这是一个不容忽视的问题。我们可以理解为这是一个硬差距,很难通过一些量化的提升(如主频)来弥补。
AMD计划在明年推出12/16核的Interlagos处理器,核心架构仍然没有明显的改变,我们还不知道它的外围设计如何,是不是还是采用HT链接两个6/8核的DIE?因为如果仍然采用G34插槽的话,就意味着内存与HT通道数量不可能有变化,届时核心所能分配的带宽也将进一步减少,这对于性能的线性提升显然是一个重大的阻碍。当然,英特尔方面也会面临这个问题,不过假设核心的性能没有较大变化的话,那么英特尔的Nehalem架构在核心数量提升所能带来的性能提高方面可能就更明显(双插槽至强7500/6500在8核心下的性能与至强X5680相当的原因在于内存带宽下降到了1066MHz,但一些第三方厂商如思科的内存缓冲芯片已经可以做到支持1333MHz)。所以AMD现在用更多的核心来填补性能上的差距只能解燃眉之急,更新处理核心设计才是根本解决之道,况且这种非原生12核心的设计也大大限制了AMD在多路平台产品线上的发挥,难道AMD真的想放弃8路及以上市场吗?我看未必,这应该是皓龙6100的设计所带来的无奈结果。因此明年的推土机(Bulldozer)架构的核心也将成为AMD皓龙家族能否真正重整旗鼓的关键。
最后,我想强调的一点是性能之外的东西,那就是价格。这也是AMD当前强调的一个重点,在笔者看来也的确有道理——产品的价格水平也将对性价比产生重要的影响,而性价比也将在很大程度上影响采购者的抉择,在本文的最后,我们再来看看以价格梯次划分的对阵情况,相信能给你新的一些信息和启示。
皓龙6100、至强7500与至强5600的价格区间对比,请结合上文的型号列表来查阅相关型号的具体核心数量
从对比表中我们能很明显看出AMD的低价战略,具备多路扩展能力的皓龙6100还没有双路的至强5600贵,至于至强7500更是一路绝尘,顶级型号的价格超过了至强5600顶级型号的两倍,是皓龙6100顶级型号的2.6倍。我们可以认为AMD这种价格策略更多的是一种在逆境中求生存的不得以的手法,但根据皓龙6100的性能表现,它也确实能在很大程度上拉回很多客户的关注度,这一点也应该是英特尔所要注意的。至强7500毫无疑问是性能的王者,不过其价格的王者风范可能在很大程度上影响用户的选择,当然它的RAS特性也决定了它的胃口已经不仅仅局限于传统的x86市场,但就至强5600而言,面对上文的性能测试对比结果,我们能明显感觉到英特尔未来在服务器市场中占有最大份额的双路平台市场上所要面对的挑战,并也能反衬出AMD反攻双路市场的决心(毕竟在这一对价格相对更敏感的市场版块里,至强7500/6500的影响力还有待观察)。
总之,在AMD的皓龙6100身上,那种悲壮的感觉已经淡化了很多,而至强家族也将面对新的竞争态势,对于用户的选择也同样如此,这也将让2010年的企业计算市场更加丰富多彩,我们当然希望这种态势能够维持下去,从而推动AMD与英特尔为我们带来更多优秀的产品!