科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航



ZDNet>服务器频道>芯片>至强5600家族全线产品与性能解析

至强5600家族全线产品与性能解析

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

代号为Westmere-EP的至强5600于3月17日(北京时间)终于正式发布,它也全面揭开了神秘的面纱。

来源:ZDNet 2010年03月18日

关键字:英特尔 Westmere-EP 交锋视点 至强5600

Westmere企业级家族成员与价格信息

代号为Westmere-EP的至强5600于3月17日(北京时间)终于正式发布,它也全面揭开了神秘的面纱。由于它与至强5500处理器引脚兼容,平台共用,所以本次发布的重点并不是相关的新款服务器,事实上任何一款至强5500服务器都只需更BIOS,然后将至强5500处理器拔出来,再把至强5600处理器插进去,就变成了一台全新的至强5600服务器。所以本文的重点也就放在了新品信息介绍与相关的性能测试成绩方面。

首先我们来看看Westmere家族企业级产品的型号列表与基本情况,见下图(点击放大):

(点击放大)

在这张表中,我们能发现Westmere家族企业级产品共面向3个市场,分别是传统双插槽服务器市场、单插槽服务器与工作站市场和嵌入式服务器市场,与上一代至强5500刚发布时要更完整(至强5500刚发布时,并没有嵌入式版本),可见平台成熟度已经成为了至强5600系列一个水到渠成的亮点,至强5500所打造的平台环境可以被至强5600无缝利用。那么在价格方面呢,至强5600相对于至强5500又有怎样的变化呢?

2010年3月14日发布的最新至强5500价格列表,但英特尔可能搞错了,把L3 Cache标成了L2 Cache

我们以6核心主频相同为条件来进行比较,结果发现至强5600平均要比至强5500贵4%左右,但如果同是4核心时,至强5600更便宜,比如E5640的价格是774美元,同主频(2.66GHz)的X5550则是958美元,虽然X5550的QPI速率更高,但E5640的L3缓存更大。按照英特尔给出的数据L5640的性能就已经和X5570相当了,所以E5640的性能肯定也比X5550要高(同一代产品型号后两位代表了性能水平,越大性能越好,相同则代表处在同一水平)。因而,从这点来说,升级到至强5600还是很有吸引力。

英特尔的数据表明,即使是 2.26GHz的L5640的性能也已经与2.93GHz的X5570相当了,但能耗下降了30%(X5570的TDP功耗是95W,L5640是 60W)

下面我们再来看看新一代至强5600的性能表现。在此之前,我们先回顾一下这两者的主要规格参数:

对于每核心平均内存容量,我们没有给出具体的数值,而只给出了平均的DIMM数量,因为单条DIMM的容量并不确定,大家可以自行根据具体的配置来计算,比如以单条8GB计算,至强5500满配时每个CPU核心平均内存容量为18GB,而至强5600则为12GB

我们注意到至强5600的核心数量增加了两个,但内存、QPI总带宽都没有变化,因此平均到每个核心上的带宽资源实际上较至强5500反而是变少了,基本上是至强5500的66.7%,这也就意味着新增加的两个核心无法像原来的那4个核心充分发挥出自己的威力,这在下面的评测成绩中,尤其是那些对内存和I/O带宽较为敏感的应用测试中能明显体现出来。

至强5600/5500性能对比测试:整数/浮点性能

在整数性能测试中,至强5600的最高端型号X5680的成绩是至强X5570的1.4倍

在浮点性能测试中,X5680的成绩是X5570的近1.26倍

新一代的至强5600相对于至强5500在基本运算能力方面有了不小的提升,整数运算性能提升幅度已经接近于核心数量的比值1.5。

在浮点运算性能方面,X5680的理论浮点性能是79.92GFLOPS,X5570的浮点性能则是46.88GFLOPS,理论上前者是后者的1.7倍左右。SPECfp_rate的测试成绩比值与实际性能成绩有较大偏差的主要原因应该就是内存与I/O带宽并没有提高,所以新增加的两个核心的性能并没有充分的发挥出来。其实从理论上讲,X5482的浮点性能(51.2GFLOPS)都要比X5570更高,但落后的FSB总线与内存带宽让其大幅度落后于X5570。

至强5600/5500性能对比测试:企业应用性能

Java应用服务器性能测试,X5680系统性能是X5570的1.3倍

SPECjAppServer2004是一款Java应用服务器(Java Application Server)的基准性能测试工具,主要是测试基于Java 2 Enterprise Edition(J2EE)的应用服务器性能,在这方面至强5600较至强5500的性能最高可提升30%。

SAP的ERP性能测试,X5680是X5570的1.42倍

在ERP服务器性能测试中,基于SAP-SD 2-Tier的测试结果显示,至强5600较至强5500系统最高可提升42%的性能,接近于核心数量的提升比例。

在基于Java平台的电子交易服务器性能测试,X5680是X5570的1.47倍

SPEC Java Business Benchmark 2005是一款用Java编写的多线程测试工具,它的评测是模拟一个企业基于若干个仓库为多个客户提供交易服务的环境,以每秒的操作数(BOPS,Business Operations per Second)来评估性能,从测试中可以看出至强5600较至强5500最多可提升47%的交易操作数量。

总体上看,至强5600在商用领域的性能幅度还是比较明显的。

至强5600/5500性能对比测试:虚拟化/能效/Web服务

VMware的VMmark测试成绩,从分值上看X560是X5570的1.43倍

VMware的VMmark测试程序以节片(Tile)为负载单位,一个节片内含6个工作负载,等效为6个虚拟机,VMware用这6个虚拟机分别模拟常见的应用,它们分别是Web服务器、文件服务器、邮件服务器、数据库服务器、Java服务器以及一个空闲的虚拟机。这6个虚拟机同时工作,VMmark测试总体的应用水平,分值越大代表虚拟化性能越高。VMwark的原理在于,只要服务器的性能有节余就增加节片,如果此时节片内的虚拟机性能没有降低,总体性能得分就会提高,但如果增加节片后,虚拟机性能下降,那总体得分也就下降,所以VMmark就截取最高分,即服务器虚拟化的最大极限,并注明此时的节片数量。

X5680系统所得到的分数为35.83/26tiles,也就是说在26个节片即156个虚拟机时的得分为35.83,而X5570则在17个节片(102个虚拟机)的情况得分为25.06。目前VMmark还没有做到以一个统一的参考基准数值来评价虚拟化性能,所以在这里只能做大概的比较,不过从所可有效支持的虚拟机数量来看,X5680足足提高了52%。

不过,X5680系统的核心数量为12个,所以与8核心的X5570系统比较有些占便宜,那么与同样是12核心的双插槽AMD伊斯坦布尔系统相比的性能又如何呢?采用AMD伊斯坦布尔处理器的HP ProLiant DL385 G6服务器的VMmark得分为15.54@11 tiles,也就是说双插槽伊斯坦布尔系统能有效支持的虚拟机数量为66个,X5680是其的2.37倍,分值的差距也在2.3倍,领先幅度巨大。

在能效测试中,X5670较L5530系统提高了约43%

SPECpower_ssj2008是服务器的性能与能耗比的基准测试工具,通过11个级别的工作负载来衡量服务器的性能与能耗表现,而至强5600借助于32nm工艺和第二代High-k技术取得了很好的成绩。

Web服务器性能,X5680较X5570提高了25.5%

在Web服务器性能测试中,SPECWeb 2005通过三个独立的测试项目还给出综合的评价,这三项目分别是面向银行业Web服务的SPECweb 2005_Banking,面向电子商务Web服务的SPECweb 2005_Ecommerce,和面向Web支持平台的SPECweb 2005_Support。至强5600平台相较5500平台,性能提升了1/4。

至强5600/5500性能对比测试:高性能计算

单结点ANSYS FLUENT 12.1测试,总体综合性能,X5670是X5560系统的1.34倍

ANSYS FLUENT 12.1提供了一组模拟流体计算的基准测试软件,通过6个不同的基准测试来评价系统在流体计算应用的性能表现,至强X5670较X5560提升了34%。

在碰撞模拟计算测试中,X5670较X5560有近1.3倍的性能提升

LS-DYNA是一个通用的是世界上最著名的瞬变动力有限元分析程序,能够模拟真实世界的各种复杂问题,可用多种行业,包括汽车设计、航空航天、制造业以及生物工程。而汽车碰撞模拟就是其典型的应用之一,这组测试中包含了三车追尾碰撞、两车正面碰撞和单车障碍物碰撞模拟计算(单节点),其中相关对最为简单的单车碰撞测试,X5670较X5560的性能提高了30%,最为复杂的三车碰撞则提升了23%,两车碰撞性能提高了25%。

OpenMP基准性能测试,X5680的性能约是X5570的1.2倍

SPEC OMP Mbase2001用来最大限度模拟真实环境下的科学与工程计算,并以此来测试系统的OpenMP运算性能,基本可以理解为单机环境下并行运算能力的综合体现。X5680相对于X5570系统,OpenMP性能提升了19.5%。

MPI环境下,在2、4、8、16节点时X5670节点集群性能分别是X5570的1.124、1.109、1.157和1.127倍

SPEC MPI2007主要考查在一个分布式的集群环境下,通过消息传递接口(MPI,Message-Passing Interface)进行并行浮点计算的性能,目前以集群形式的HPC系统基本上都是基于MPI架构组建,SPEC MPI2007测试了2、3、8、16节点(基于InfiniBand 4x QDR和千兆以太网)时的性能表现。

在2、4、8、16节点时X5670节点集群性能分别较X5570提高了12.4%、10.9%、15.7%和12.7%。而以各级节点数量的性能能增长来看,4节点较2节点时,性能提高了86.9%、8节点较4节点提高了89.7%、16节点较8节点提高了74.7%,反观X5570,各节点数量提高一档后性能提升幅度分别为91.5%、81.8%和79.2%,从中可以看出至强5600在MPI扩展性能提供幅度方面稍逊于至强5500,这应该与每核心分配的内存与I/O带宽更低有关,不过从4节点向8节点扩展时,X5670的提升幅度反而较2至4和8到16节点扩展时更高,显得与众不同。

Black-Scholes成绩,X5680比X5570少用时7.23秒

Black-Scholes是金融业中常用的期权模型算法,也可以认为是一种典型的金融类运算模型,Black-Scholes的测试结果也基本上能代表了该系统在金融计算中的性能。在这个测试中,X5680的计算用时较X5570减少了7.23秒,即性能提高了38.6%。

至强5600的性能扩展保持着近乎于线性的效率

在核心效率方面,通过单插槽与双插槽的X5680的性能对比来看,LINPACK的浮点运算性能达到了2倍的提升,整数与Java商业性能也得到了1.98和1.99倍的提高,而浮点性能提升比例为1.96倍,体现出了优秀的扩展效率,基本达到了1:1的线性扩展比例。

综上所述,至强5600系列在HPC领域的较至强5500系列的提升幅度并不如其在商业应用中的表现,归根结底应该还是与至强5500相同的内存与I/O带宽拖了后腿,使其新增加的两个核心未能充分的发挥作用。我们可以做个简单的计算,若以X5680与X5570的理论浮点性能比——1.7去剩以0.67(6核心至强5600每核所分带宽较4核心5500的比例),结果是1.139倍(即浮点性能增幅为13.9%),这与上面的一些综合基准测试的结果基本相符。当然,这个计算并不精确,但能说明一定的问题。

不过在不少应用基准测试中,至强5600基本上得到了30%的性能改善,这对于HPC应用来说已经难能可贵了,因此我们也非常期待至强5600在今年全球乃至中国HPC市场的出色表现。

综合评分:8.13 分
云能力:8.3 分
营业额:533亿美元[2012]
云服务:英特尔云计算

查看更多 >>

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅ZDNet技术邮件将是您的最佳途径之一。