扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
eX5服务器与关键业务承载
这里的关键业务就是指企业的核心应用,往往也是最高负载应用,比如数据库、ERP等,这种应用的特性我们已经很清楚了,它们对内存、存储I/O,以及高可用性都有很高的要求。
eX5服务器本身就是基于高RAS特性的至强7500平台设计,再配合IBM自己的独特设计,在可用性方面已经有足够的保证。
至强7500的RAS设计,提供了20多项的功能,以保证系统的高可用性
IBM在新一代x服务器上所体现的一大特色就是完全的免工具拆解设计,早在3月份的X5架构发布之日,IBM就演示了eX5服务器免工具拆解过程,而这种设计也将极大提高系统的可维护性,下面我们可以看看x3850的设计。
秉承免工具拆解设计,x3850X前面板很容易拆下来,之后就是两个薄型的散热风扇,它们是为内存散热准备的
4颗Nehalem-EX处理器一字排开,前面是8个内存插卡,可两两互为内存镜像
在CPU之后是两个1975W的电源,电源风扇也起到了为CPU散热的作用
注意电源下方的可伸缩金手指插口,这是电源热挺拔的设计重点
当提起电源扳手后,金手指插口收起,就可以从后方拔出电源了
机箱的后半段(电源+I/O仓)也是免工具折解,可以整体的拆出来
而在性能方面,IBM的eX5也有自己独特的优势,这主要体现在高度灵活的CPU与内存可扩展性和高存储I/O性能方面。
IBM独特创新的MAX5内存扩展加速器,让eX5服务器可额外获得24至32DIMM的内存扩展能力,而无需额外增加CPU
eX5服务器自身扩展和与MAX5组合时扩展的级联架构
通过QPI电缆进行互联,HX5刀片可以扩展成4插槽刀片,3690X5也可以扩展成4插槽的机架服务器,而3850X5则可扩展成8插槽的系统,而内存容量也将成倍增加,与其他厂商标准化设计的Nehalem-EX服务器相比,内存容量最多可达对手的两倍,如果以当前最高水平的单条DIMM 16GB容量计算,两台带有MAX5-R内存扩展的3850X5的级联之后的8插槽系统即可获得高达3TB的内存容量
通过MAX5内存扩展加速器,在双插槽的平台下,可以比其他厂商的至强7500服务器多出一倍的内存容量,达到其他厂商4插槽的至强7500服务器的水平。这一特性对于数据库、ERP等关键业务应用绝对不可小看。再此基础上,再通过FlexNode级联扩展模式,可以让一台双插槽的eX5服务器变成一台4插槽的系统,内存容量对其他厂商的8插槽7500服务器一样,这种可扩展能力,为弹性的,灵活的应对关键业务规模扩展需求提供了很好的基础。
此外,由FlexNode的级联扩展设计不引出了一个新的功能——既然能合在一起,也就能分得开,而且这一切是自动的(需要在UEFI中设置),从而使eX5服务器在获得级联扩展能力的同时,也具备了节点容错能力。而与其他的容错技术加在一起,就具备了eX5服务器的 另一个创新之处——OnForever可靠性。
通过以前的FlexNode技术的介绍,我们不难理解2插槽+2插槽变4插槽的二合一的原理,那么反过来也一样,通过专用的固件与管理软件的配合,FlexNode也具备了Node FailOver的能力,当级联的两个节点其中一个有问题时,或是应用的需求要让级联的节点分开时,可以再一分为二,将有故障的节点隔离,或是变成两个独立的节点,这种灵活的设计显然增加了级联系统的可靠性。
此外,eX5还具备很多其他的容错技术,包括ChipKill的内存校验功能(可应对数据位错误)、Memory ProteXion内存保护能力(可应对单颗内存芯片失效)、内存镜像功能(可应对单块内存插失效)和内存擦洗功能(定期的内存可靠性检测),另外还有预测性的故障警报功能,可覆盖CPU、内存、硬盘/SSD、风扇以及电源、QPI电缆等关键设备,再配合Nehalem-EX自己的容错技术,以最大限度的保证eX5服务器的高RAS特性。
最后一点,IBM针对数据库应用而专门推出了定制化的x3950X5,标配eXFlash SSD,最高可配16块eXFlash SSD,以现有的单盘50GB计算,共800GB,未来可达3.2TB(单盘200GB)。而x3690X5则可以配到24块eXFlash SSD,最高容量可达1.2TB(单盘50GB)/4.8TB(单盘200GB)。
8块eXFlash SSD相当于800块传统硬盘的IOPS响应能力,而成本则节约了97%,功耗只有后者的1%,优势明显,而借助后端的专业存储系统,则可以更合理的分配存储资源,而不必为了满足IOPS而低效率的添加硬盘
由于eXFlash系统是IBM自己设计定制的,因此相对于采用通用设计的SSD方案在性能方面可获得最大的保证,最关键的是,结合上面的级联扩展能力和便捷的可维护性与高RAS特性,x3850X5/x3950X5可以为企业的关键业务提供最大的性能与可用性保证。而即使是x3690X5与HX5也具备较同级产品更强的关键业务承载能力。
eX5服务器与虚拟化/云计算在虚拟化应用方面,eX5的创新设计也能提供良好的支持,前面谈到的FlexNode技术与eXFlash SSD在虚拟化方面也均有很大的用武之地。
虚拟化与云计算对于系统的可扩展性要求很高,当你的虚拟化/云计算架构搭建好之后,虚拟机的数量与位置就在不断的变化中,而当业务扩展时,也需要基础平台能迅速提供相应的虚拟化供给能力,此时FlexNode技术就可以让企业立即获得比集群更好的扩展模式,获得更好的单节点性能。
而eXFlash SSD的高IOPS性能在应用多虚拟机并发访问时,当承载的虚拟机数量越多时,其相对于传统硬盘的优势就越明显,尤其是承载多个数据库应用时,SSD的随机并发寻址能力将得到最大的体现。
不过相对来说,虚拟化对系统资源最为渴求的,应该是内存资源了,而这正是eX5服务器的拿手好戏。
内存对于虚拟化的重要性不用太多论述,举个很简单的例子,如果要做虚拟桌面,一个虚拟桌面对应的虚拟机需要1GB的内存,那么如果一台服务器只有128GB内存,那么其上限也就是128个虚拟桌面,无法再增加(虽然现在有些VMM已经有内存过量供给和压缩功能,但对于桌面虚拟机并不是长久之计,毕竟涉及到用户体验这一重点问题)。
如今处理器的性能越来越强劲,因此在很多时候可能CPU仍然有富裕的资源可供利用,但因内存资源枯竭而不能再增加虚拟机,从而无法提供更强的虚拟化性能。至强7500平台的内存扩展能力已经相当强悍,但是基于NUMA(非一致内存访问)架构的设计(至强5500/5600也是这一架构),使得至强7500相较上一代的至强7400有一个问题,那就是内存的扩展能力与CPU数量相挂钩,这也让内存扩容的成本显著提高。
IBM X4服务器的架构,内存连接于内存控制器,被CPU共享访问,这就是SMP架构,内存的扩容与CPU数量无关
至强7500平台的架构,内存控制器集成于CPU,所以要扩充内存,就要先扩充CPU,而一颗至强7500处理器的成本可不是小数目,如果插槽满了,就要购买新的服务器了……
为此,IBM在X5架构中提供了MAX5内存扩展加速器来解决至强7500平台的内存扩容问题,机架服务器不需要添加新的CPU和即可额外获得32DIMM的内存扩展能力,以16GB DIMM计算就是512GB的容量,而刀片服务器则可获得24DIMM的扩展能力。而其他厂商的产品,则要获得这些额外的内存容量,就得再配台服务器了。
IBM基于x3690X5双插槽至强7500服务器进行的虚拟机负载能力对比测试
在IBM基于VMware平台的测试中,通过不断的添加虚拟机以查看服务器的负载情况,最后的虚拟机数量是80个。基于至强5500的双插槽服务器由于内存容量有限所以要不停的增加服务器,最终加到了4台,而x3690X5不带MAX5的情况下,最终也增加了一台以保证内存容量,而x3690X5加上MAX5则不受影响,这样就意味着一台x3690X5+MAX5的虚拟机支撑数量可达到4台至强5500的水平,由于虚拟化软件是按CPU插槽授权,所以光授权许可费用也就差出4倍,虽然x3850X5的单台价格是至强5500服务器两倍还多,可最终的计算下来,虚拟机成本只是4台至强5500的56%。
在刀片服务器方面,HX5+MAX5的表现同样不俗
在双插槽的刀片服务器方面也是如此,在160个虚拟机的负载下,至强5500刀片需要5台,而HX5+MAX5是两台,总成本核算下来,每个虚拟机的成本是至强5500刀片的70%,便宜的至强5500最终输在了软件和因内存扩容而添加服务器的成本上了。
那么对于VDI的应用,至强5600平台虽然虚拟化性能比至强5500更强,但面对内存的瓶颈,在最终成本核算前,可能与双插槽的eX5服务器相比并不占优,虚拟机数量越多,这种反差可能也就更明显。因此MAX5的出现,让eX5服务器具备了与至强5600展开竞争的资本。
512GB的x3850X5已经可以在Hyper-V系统上支持高达384个虚拟机(每个虚拟机1GB的内存),并能良好的运行,而如果加入MAX5的扩展的话,相信还可以进一步增加(不过现在微软的Hyper-V还没有加入对MAX5的支持)
虽然可能有人会说,MAX5现在还不被最新的vSphere 4.1所支持,但是IBM的测试就是在VMware平台上进行的,这说明相应的产品已经在路上,预计在2010年第4季度vSphere就会发布相应的更新,详细情况请注意IBM的官方发布,或咨询IBM经销商。
当然,有人会说eX5做虚拟化可能有些浪费,但如果结合eX5本身的定位和未来的IT架构的发展趋势来讲,eX5与双插槽的系统,如至强5600并不冲突,由于至强7500本身的特性(可扩展、RAS),使得它可以在虚拟化环境下承载关键业务,这是一个质的不同,至强5600则还没有这个能力,所以在很多时候,eX5的这种能力可以与中低端的服务器形成很好的互补,而如果有特殊的需求,eX5可以做到一机通吃,即将轻重负载的应用放在同一平台上,以提供更好的集成性与可管理性。
eX5服务器与高性能计算高性能计算是一种典型的CPU与内存密集应用,在这方面至强7500相对于双插槽系统有先天的优势,这主要是与其高可扩展特性性分不开的。
其实现有的很多HPC系统都是以集群的方式来构建,通过MPI来互联沟通,这也是一种性价比非常高的HPC系统架构,因此从总体上进,主流的HPC系统都是双插槽的处理器平台,而不是多插槽可扩展的。但是,HPC的应用也有很多种,就某些应用来讲,则需要分别对待,并不见得至强5600这类的双插槽系统都可以胜任。
首先,某些应用需要更大的内存空间才能保证计算的效率,比如256GB的内存空间,而这是至强5600系统给不了的。
油藏模拟IMEX计算测试,4插槽至强X7560系统是双插槽至强X5570系统的2.4倍
CMG公司的IMEX软件是一款著名的油气藏模拟器,用来模拟分析三种状态下天燃气混合流动情况,包括气-水、油-水、油-水-气。它的计算很多时候都需要256GB内存的支持(比如对54万个油气穴和50口井进行15年的模拟推演),这在至强55/56系列平台上是不可能的。在这个测试中,至强X5570满配144GB DDR3-1333内存,而4路至强X7560平台则256GB DDR3-1066内存。结果,至强X7560平台性能是X5570的2.4倍(由于MPI效率的问题,至强5570组成集群不可能达到线性提升的效果,所以4插槽的至强7560基本上快相当于三台至强5570的计算能力)。这也再次体现出,拥有高度内存扩展能力的至强7500在某些HPC领域中的不可替代性。
另外,有的应用只有OpenMP的版本,而没有MPI版本,比如比如研究大气污染传输模式的GEOS-CHEM,也就是说你不能在集群上执行这个应用,只能在一个单机上跑,这个时候单机的性能越强,这个软件的执行效率也就越高,这样至强7500强大的可扩展能力就有了用武之地,夸张点说,最高可扩展至256插槽的系统,已经比得上很多小集群的HPC性能了。
而说到eX5服务器,它的级联扩展能力,对于OpenMP计算应用来说,是如虎添翼。我们用双插槽设计的x3690X举例来说,凭借着32个DIMM+MAX5内存扩展能力,也提供了一种高级双插槽HPC方案,关键是它还能扩展至4插槽+128个DIMM的大系统,给HPC用户提供了足够的灵活性。如果还嫌不够,x3850X5还能提供最高8插槽+3TB内存的运行环境,而IBM还保留了未来推出的4机级联的技术空间,这是其他厂商的产品很难比拟的。
从X架构诞生之日起,4机级联就是IBM的标准设计,而对于eX5服务器来说,目前只到双机的级联规模,但其实在IBM的规划中,通过它独有的EXA总线做到4路级联是完全没有问题的,就看有没有市场需求了
此外,eX5服务器中的eXFlash SSD也将对HPC产生非常积极的影响。
SSD无疑是未来HPC系统的一个首选,从数据传输能力来看,SSD(固态盘)已经目前占优,而在IOPS方面,SSD更是达到了HDD的百倍
英特尔基于双硬盘系统的HPC(逆时偏移计算)测试结果
英特尔基于双SSD系统的HPC(逆时偏移计算)测试结果,可以看出来采用了SSD之后,获得了1.6倍的加速,这是在没有做任何其他优化的平台上产生的结果,还是非常诱人的
还是以x3690X5为例,其最大可支持24块eXFlash SSD,比x3850X5还多8块,即使在RAID 5模式下也可以提供足够的I/O带宽,而HX5刀片也是采用两块SSD的设计,这些都将能进一步提高HPC的运算效率。
因此,我们可以总结一下,在HPC应用中有很大一块是现有至强5600这类平台所不能很支持的,而这类应用都需要更大的内存,更大的节点可扩展能力,另一方面,SSD也对于HPC应用有很大的帮助,所以再结合eX5的创新设计,我们不难看出,对于HPC胖节点的应用,eX5确实是最佳之选。