扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:ZDNet 2010年03月10日
有关于Nehalem-EX(至强7500/6500系列)与Westmere-EP(至强5600系列)的介绍,在此之前我们已经有不少相关的专文了,比如《英特尔与AMD:企业计算之两虎相争2010》、《Nehalem-EX与皓龙6100家族全接触》等等,不过随着两者发布日期的日益临近(Nehalem-EX预计3月31日发布,Westmere-EP则定于3月17日发布),英特尔也再次专门的对这两款处理器进行了新的信息披露,同时就英特尔所倡导的“智能计算”进行了重点的阐述。而我也觉得有必要做最后一次的梳理,以帮助大家更好的了解这两款产品以及它们的市场定位。
首先要强调的,还是英特尔对于企业级处理器市场的划分。总体上,英特尔将服务器用CPU分成了3个等级,即低端的入门级(Entry ,简写EN)、 主流的效率性能级(Efficient Performance,简写EP)以及高端的可扩展级(Expandable,简写EX),在服务器平台或类型方面,英特尔也有三个划分,即低端的单路(UP)服务器,中端的双路(DP)服务器和高端的多路(MP)服务器。因此,会有人将EN/EP/EX处理器与UP/DP/MP平台对等起来。事实上,UP、DP、MP只是代表了服务器的插槽数量,它与处理器的等级还是有些不同。比如一般人会觉得EX处理器就是为了MP服务器所使用,但是EX是指处理器本身的可扩展性,所以我们也能发现双路的EX处理器平台。比如,采用两颗至强7400的服务器,你说它是MP系统还是DP系统呢?显然,两颗7400处理器的服务器在当前的配置下就是一台DP服务器,但它可扩展至MP服务器,这是EX处理器所追求的可扩展能力的最明显体现(除此之外还有内存的扩展能力)。所以在分析新一代EX处理器时,并不能简单的以DP和MP来区分。
另外,英特尔在2010年所主推的理念就是“智能计算”,其所强调的是按需、自动与可扩展,解释开来,就是处理器的性能可自适应不同的工作负载,并因此实现自适应平台能效调节,从而具备更为灵活的虚拟化支持能力。所以在下文的介绍中,我们要结合英特尔的处理器与服务器平台划分,以及“智能计算”来看待即将发布的这两款新品。
首先我们来看看Westmere-EP,即至强5600。它将是2009年里取得重大成功的至强5500的标准接班人,而英特尔也希望它能在性能、能效与虚拟化方面延续至强5500的辉煌表现。
至强5600的家族成员与简要规格对比
至强5600的平台与至强5500完全通用,OEM厂商只需更新BIOS,即可在原插槽上直接插入至强5600,以便快速导入全新产品线
至强5600的主要特性,在性能、能效与虚拟化性能方面均较至强5500有所加强
根据英特尔的数据对比,至强5600最高可达至强5500性能的1.6倍,而在性能相同的情况下能耗则会下载降低,并且还准备有更低功耗的型号(至强5500最低功耗型号为80W,至强5600则有40W的规格),同时配有改进后的能耗管理算法。此外,除了CPU本身更为省电之外,在至强5600平台上还引入了低电压DDR3内存,较标准电压的DDR3内存,单条即可节省2W的电力,再配合更新后的内存管理算法,能耗得到了进一步的降低。在虚拟化方面,新增加的AES-N指令将有效的提高加密虚拟化环境下的实际运行效率。
英特尔的数据表明,即使是2.26GHz的L5640的性能也已经与2.93GHz的X5570相当了,但能耗下降了30%(X5570的TDP功耗是95W,L5640是60W)
在至强5500发布时,英特尔给出的等效比是1:9,即1台至强5500服务器的相当于9点单核心至强服务器。以至强5500服务器替换旧的单核心服务器后,8个月可收回成本(即ROI为8个月)现在至强5600将这一数字提高到了1:15,ROI也缩减到了5个月
伴随着全球经济的好转,很多分析机构以及英特尔均认为IT架构设施的更新换代热潮也即将来临,在2009年,英特尔的4核心及以上处理器的出货量已经超过了一半,而全球还有80%的服务器是基于单核心(38%)与双核心(42%)的处理器,所以更新市场巨大
最后我们来看看至强5600与前辈至强5500的规格对比。
虽然们是以服务器版本的最高级别型号(X系列)为对比基准,不过在上表中,最高主频为3.33GHz的至强5600的TDP功耗为130W,若以与X5570相同的95W的TDP功耗为条件的话,至强5600的最高主频也是2.93GHz,但即使是这样,它的单CPU与双插槽系统的浮点运算能力也达到了70.32GFLOPS和140.64GFLOPS,是至强5570的1.5倍,也全面领先AMD的伊斯坦布尔。因此,至强5600除了企业应用性能与能耗表现更为突出外,它也将是2010年非常抢眼的高性价比的高性能计算(HPC)平台。在今年6月份的第一期HPC全球TOP 500强的名单中,相信就会有不少采用至强5600的系统出现。
Nehalem-EX:替换RISC系统、让智能计算更加坚固可靠如果说至强5600的出现,让智能计算得到进一步普及的话,那么面向高端可扩展系统的Nehalem-EX——至强7500/6500系列就肩负了另一个重要的使命。它将让企业的智能计算,更加坚固可靠,即让x86服务器平台也具备像小型机那样的RAS(Reliability, Availability and Serviceability,可靠性、可用性与可维护性)特性,以应对关键业务(Mission Critical)领域的需要。并且,由于多路平台本身就是虚拟化的理想载体,所以Nehalem-EX也将让x86虚拟化平台也具备了高RAS特性,这为虚拟化能进入关键业务领域打开了基础之门。
长期以来,RAS特性是那些基于RISC架构的小型机攻击x86平台最多的地方,也因此虽然在很多性能方面小型机已经不占优势,但就是因为RAS这个“壁垒”而让x86服务器无法更上一层楼。如今,英特尔在Nehalem-EX家族身上植入了更为强大的RAS特性,尤其是自动检验架构(MCA,Machine Check Architecture)的引入,让Nehalem-EX已经具备了基本的关键组件(CPU与内存等)容错能力,再加上QPI新一代的互联总线标准,让Nehalem-EX也具备了32插槽的扩展能力,所以不用说大家也能知道它的潜力市场也直指RISC小型机。
就像一些小型机厂商将自己的高级计算也用到了x86服务器上一样,英特尔也将其高端的安腾处理器(Itanium)与顶级的x86处理器实现最大的技术共享,比如平台的通用性,以方便OEM伙伴灵活的部署
虽然同时面向关键业务市场,不过Nehalem-EX与自家的安腾家族并不冲突,因为本身的生态环境就不一样,作为两种生态环境的必然延续,Nehalem-EX与新一代安腾3都有存在的道理,而且由于编程环境与架构的不相同,也无法在一层面上去比较。按照英特尔的话说,安腾是具备有最高RAS级别的英特尔处理器,作为唯一的EPIC架构处理器的代表,其唯一的对手就是RISC,而Nehalem-EX则是x86向上发展的一种代表,它的目标已经不再仅仅是同级别的x86对手,也将在RISC替换市场与安腾一道作战,共创英特尔的处理器霸业。
Nehalem-EX的RAS特性概述,主要分为三大目标
Nehalem-EX的RAS具体设计
从Nehalem-EX具体设计上,我们可以看出来Nehalem-EX在三个方面的具体改进,与前一段时间刚发布的IBM POWER7相比,在很多RAS功能上都已经是很相近了。不过,RAS是对一个系统整体的描述,而非是单一的处理器,从Nehalem-EX的设计中也能发现,很多功能如果没有操作系统/软件层面上的支持,是不可用的。所以针对Nehalem-EX的推出,ISV也将做好充分的准备。
Nehalem-EX在软/硬件界所获得的支持
根据英特尔的数据,目前全球已经有15家有着自己深厚设计功底的OEM厂商打算生产32插槽的Nehalem-EX系统,而8插槽的Nehalem-EX生产厂商将会更多。在软件方面,以Novell、Redhat为代表的Linux平台,以微软为代表的Windows平台和以VMware为代表的虚拟化平台都将支持Nehalem-EX的RAS新特性。不过,最终系统所具备的能力将取决于OEM厂商的设计与配置。
最后我们再来看看Nehalem-EX家族的型号,可以看出它涵盖了MP与DP两个平台,由于QPI的点对点设计,所以这种设计上的改变是很容易的,而QPI的数量也意味着其最大的插槽数量。从中我们能看到在Nehalem-EX家族中,英特尔也准备了专门面向DP平台的至强6500系列,因此我们不能再机械的认为EX处理器就是为MP平台设计的高端CPU。
至强6500系列的目标就在于为DP市场引入更强的可扩展能力,当然这个能力不是指CPU插槽的提升,而是指内存容量的扩展。在很多应用场合,CPU的数量与性能可能足够,但内存容量确是一个瓶颈,而由于平台的限制,若想再增加内存,只能再买台服务器。比如常见的虚拟化应用,对于内存的消耗量就非常巨大,这也是为什么IBM会开发X5架构,以外接内存扩展加速器来达到扩展内存的目的,但这个平台也是基于Nehalem-EX的。所以至强6500就是了为这种细分市场所设计的,因为从浮点运算能力来看,它还不如至强5600(8核心的X6550的浮点性能为64GFLOPS),能耗还高,但它可以扩展到32根DIMM,而至强5600最多只有18根DIMM(思科的UCS因为有自己的专用内存缓冲芯片,可达48根,不过IBM的X5可扩展至64根),平台的内存容量可达至强5600平台的1.78倍,这对于那些不需要太高级的CPU,但需要极高容量内存的客户来说,明显更为适用。
附:什么是智能计算?英特尔所倡导的智能计算,是一种类似于人类用脑的模式在CPU负载表现上的一种体现。我们可以想象一下人脑的工作模式,它可以根据我们的工作需求而调动不同数量的脑细胞,这涉及到了你的注意力和精力。比如你可能经常会出现一心二用的情况,也会出现一心一意的工作状态。你可能在整理一些资料时,还能在QQ上与朋友聊天,但当你工作很忙时,你很可能就会忽略了QQ上朋友的发言,以便全力以赴的把工作干完,处理器也理应如此。
从至强5500开始,英特尔的智能计算就初露端倪
最理想的状态是,CPU占用率与功耗的曲线应该是吻合的,即需要多高的性能就索取多高的功耗,而从至强5500开始,英特尔的处理器正在努力的向理想状态迈进
在早期的CPU,一般只要一开机就会以最高主频来工作,工作状态可能就两种——开机和关机。后来,CPU的主频可以根据工作负载来调节,但可调节的级别很少,工作状态可能扩展至“关机、低频、中频、高频”4种状态,但就像汽车的变速器一样,档位越多,就说明越能让发动机的功率与当前的时速更好的配合,所以汽车的档位越多,也就意味着更省油。对于处理器,也是如此,英特尔所追求的智能计算就是能像人类大脑那样迅速的对工作负载做出反应,并且又能像汽车的自动变速箱那样,以更为细密的功耗状态级别来应对不同的级别的工作载荷。当然,能像大脑那样平滑而迅速的进行计算力与能耗的调配则是未来的终极目标。
Nehalem架构将功率管理的状态从上一代的4个,提高到了15个,可自动的根据工作负载来调节主频也就是功耗。这就相当于为处理器安上了一个15档的自动变动速器。同时它还提供了智能超频的功能——TurboBoost(部分处理器不具备TurboBoost,但仍然拥有15档功耗调节的功能),它可以看作是一些高档轿车自动变速箱上的“S”档位,专门应对急加速等极限驾驶。
TurboBoost可以根据CPU核心的工作负载的分配情况,来调节CPU核心的工作状态和工作频率,当应用软件多线程优化并不充分时,有可能会出现部分核心满负载,而部分核心轻负载的情况,这个时候TurboBoost会将轻负载的核心切换到空闲状态,而将剩下的核心频率在TDP功耗允许的范围内进行超频,以133MHz为一个超频单位。以至强X5570为例,标称为2.93GHz,但可提升两个单位的频率至3.2GHz,浮点性能也将提升近10%。
双插槽至强5500系统的TurboBoost演示,程序从单线程向最高的16线程递进,在单线程的情况下,可以看出大部分的CPU核心是空闲状态,而工作核心可以进入Turbo状态
在全额高达16个线程时,TurboBoost也可以根据CPU内部各组件的工作状态,来挤出可用的能耗进行智能超频,比如在整数运算时,浮点单元就是空闲的,它所占用的功耗就可以被贡献出来
从这张图中,可以看出不同负载的线程核心的运行频率是不同的,展现了Nehalem架构下的动态功耗调节功能
英特尔强调的智能计算并不仅仅指处理器自身的调节,还包括更大的系统范围内的智能调节,而且这种调节已经不仅限于计算能力与功耗的调节了。由于虚拟化的迅速普及,大型的虚拟化资源池已经是越来越常见,而它也是未来云计算的基础平台架构。在这个虚拟化资源池中,意味着数据是可自由流通的,而数据是随虚拟机生成的,所以虚拟机在池中的自由迁移将是非常必要与是非常常用的功能。虽然虚拟化的管理更多的是软件层面的事情,但硬件的智能性,也将对于虚拟化的智能管理提供良好保障。在这里,英特尔也为虚拟化提供了越来越多的基础硬件功能和加速技术让虚拟机的迁移平滑而迅速,同时与相关的虚拟化软件厂商配合,即使是在不同架构核心的英特尔处理器之间,也可以实现虚拟机的迁移。
将一个运行着CPU加载程序的虚拟机从一台至强5400服务器向一台至强5500服务器上迁移,同时不断的检测Ping值,从中可以发现在迁移过程中,画面并没有中断,但有一瞬间虚拟机是不在线的(或者说存在巨大延迟)。如果没有实时的Ping值检测,在实际使用中,基本不会察觉到这种延迟
演示的平台是基于VMware环境,在最新的vSphere平台上,VMware提供了FlexMigration的功能,通过增强型VMotion兼容性(EVC,Enhanced VMotion Compatibility)模式,可以实现跨代英特尔处理器之间的虚拟机迁移
目前,在最新的VMware vSphere平台上,通过EVC模式,用户可以顺利的在Penryn(至强5400、7400等)、Nehalem(至强5500)以及最新的Westmere(至强5600)平台上进行虚拟机的相互迁移,而向更高级平台迁移时即可享受到高级平台的新特性,如新一代的SSE指令集。
相应的,Nehalem-EX所具备的MCA也可算是一种智能的特性,它能预先对可能将出现问题的组件报警,而在组件真的出现问题可以尽可能的屏蔽或是恢复,并将负载从有问题的组件上转移至安全稳定的组件上(CPU核心、内存、QPI等),这些都可以看做是一种智能,只是没有体现在性能与功耗管理上而已,并且这些新的功能得以实现,在很大程度上也要利益于新一代的操作系统,这其中肯定也少不了英特尔与相关ISV的密切合作。
综上所述,英特尔的智能计算并不仅仅指处理器本身,它是以处理器为基础,而在整体的、综合的系统表现上予以突出,包括了智能的运行性能分配、智能的能耗管理、智能的容错机制等等,这一切将在至强5600与至强7500/6500所构成完整的Nehalem企业计算平台上将得到完整的体现,反过来也可以说只有采用英特尔的处理器,再配合相应的基础架构软件,才能获得最好的“智能计算”的体验。