扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
虽然x86服务器至今还无法取代RISC,但逐步渗透RISC把控的关键任务市场已经成为一种趋势。而英特尔至强7500平台的问世,让这种趋势更加的明显。
x86蚕食RISC市场
关键任务(Mission Critical)指那些除了计划内的停机,需要7x24小时不间断工作的业务,比如医疗系统、证券交易、电信系统、金融分析、航空管理系统等等。这些社会服务类的业务一点出现意外中断,对社会造成的不良影响以及造成的损失都是巨大的。比如据Qualix Group统计,1分钟的宕机平均会使运输业损失15万美元,银行业损失27万美元,通信业损失35万美元,制造业损失42万美元,而证券业损失高达45万美元。
业务的不间断性要求承载关键业务的服务器需要高度的可用性和可靠性,比如某国有大型银行的业务系统要求高端服务器系统的可用度达到99.999%,计算下来每年停机不过5分钟。这样的可靠性和可用性是传统的x86服务器无法达到的,所以一直以来在金融、电信、能源、交通等关键应用领域,后台中枢服务器常常由带有容错功能的高端RISC服务器来担当。
高端RISC服务器和x86服务器最为本质的区别在于具备RAS特性,即Reliability, Availability, Serviceability:可靠性、可用性、可维护性,来满足关键任务应用的需求。另外,在可扩展性上,RISC服务器通常可以支持8至64颗处理器,而以往的x86平台在扩展性上远远不及,由于CPU设计的局限性和主板布线困难等原因,x86平台很难扩充到8路以上,在性能上也无法和RISC服务器相媲美。
不过,x86平台近年来发展迅速,在核心和线程数量上不断激增,性能和扩展能力都在不断增强,在应用上也日趋灵活广泛,在价格上也要更加低廉,逐渐对RISC造成了威胁。虽然RISC服务器的应用和解决方案已经比较成熟,关键任务用户为了业务的正常运行并不会轻易进行平台的迁移。
不过从市场的表现来看,RISC服务器已经不复辉煌,连年呈现下滑趋势。据IDC的报告,从2000年到2008年,RISC市场基本都出现了下滑,2008年RISC处理器出货量甚至不足2000年的一半。而在2009年的Gartner服务器市场调研报告中,第四季度全球RISC和安腾芯片的Unix服务器出货量稍有增长,但销售额下降了20%。
虽然x86服务器至今还无法取代RISC,但逐渐渗透RISC把控的高端市场已经成为一种趋势。而英特尔至强7500平台的问世,让这种趋势更加的明显。
今年3月,英特尔推出了具有划时代意义的至强7500服务器处理器平台。至强7500核心代号“Nehalem-EX”,是迄今为止英特尔至强家族中最具扩展性、最高性能、最为“智能”的的服务器处理器。最为核心的,至强7500引入了20多个移植自安腾平台的RAS特性——这是之前的x86处理器所不具备的。至强7500的发布,将x86服务器的可靠性推进到一个新的高度,足以媲美高端RISC服务器,剑锋直指关键任务领域。
至强7500:前所未有的可扩展性
RISC服务器的扩展性是以往的x86处理器难以望其项背的,至强7500的出现打破了这种局面,这要归功于先进的QuickPath互联架构。至强7500具有4条速率高达6.4GT/s(每秒传输6.4G次,双向传输速度为25.6GB/s)的QPI总线,使得至强7500可以在没有节点控制器的前提下构建8路系统,结合第三方控制器,可以扩充到16路甚至32路。至强7500处理器最高具有8个核心,通过英特尔超线程技术支持16个线程,可以轻易组建8路128线程的多路多线程SMP系统。
前所未有的扩展性
可以看到,在扩展性上至强7500相比之前的x86平台有了质的飞跃,相比RISC系统也是不遑多让。带宽也曾经是让x86的一个短板,至强7500在这方面有了新的进步——集成四通道内存控制器,采用DDR3-1066规格内存,具备6.4GT/s的QPI总线速率,使内存带宽提高到至强7400平台的9倍!Nehalem-EX主要是面向的是大型虚拟化整合、ERP、数据库类的应用,在数据库性能上,相对至强的7400平台提升了2.5倍。由此可见,至强7500打造的多核多路系统已经具备了和RISC竞争的能力。
媲美RISC的RAS特性
RAS特性(Reliability, Availability and Serviceability,可靠性、可用性与可维护性)具体来说,可靠性要求计算机能够持续运转,从来不停机。可用性要求重要资源都有备份,能够检测到潜在要发生的问题,并且能够转移其上正在运行的任务到其它资源,以减少停机时间,保持生产的持续运转,并具有实时在线维护和延迟性维护功能。服务性要求能够实时在线诊断,精确定位出根本问题所在,做到准确无误的快速修复。
至强7500的横空出世让x86服务器在关键任务领域的境况大为改观。英特尔为至强7500引入了移植自安腾处理器的RAS特性。据英特尔介绍,至强7500拥有x86系统里最高级别的RAS,和RISC小型机相比,在RAS方面已经差距不大。其中最为重要的就是自动检验架构(MCA,Machine Check Architecture)恢复功能。
MCA恢复功能是安腾平台上的特性,功能是在不需要系统停机的情况下监测和纠正CPU、内存和互联架构中的错误。这对虚拟化环境而言非常重要,使得一台运行多个虚拟机的物理服务器不需要关机来查找错误,而只需要关闭或迁移其中部分虚拟机,保证整个系统的正常运行。MCA恢复是一个系统级别的RAS特性,不仅包括CPU、内存和I/O,还需要操作系统的支持,目前VMware ESX和Windows Server 2008 R2、Novell SUSE Linux和Red Hat Enterprise Linux等系统都已经可以支持这一特性。
当然,至强7500所具备的RAS特性并不仅仅是MCA恢复,而是包含三大部分:数据保护、增加可用性、最小化宕机时间,总共具备22条,下面来具体看一下:
至强7500 RAS特性 | 类别 | 目标 | 特性 |
---|---|---|---|
保护数据 | 降低关键级别的错误;通过系统检测数据错误;限制错误产生的影响; | Parity checking and ECC | |
Memory Themal Throttling | |||
Memory demand & patrol scrubbing | |||
Corrupt data containment | |||
QPI viral mode | |||
QPI rolling CRC | |||
增加可用性 | 恢复失效的数据链接;从失效的CPU&内存中迁移负载;从无法修正的数据错误中恢复;预测失效发生; | Intel SMI Lane Failover | |
Intel SMI Clock Failover | |||
Intel SMI & QPI Packet Retry | |||
QPI Clock Failover | |||
QPI Self-Healing | |||
SDDC plus random bit error recovery | |||
Memory Mirroring | |||
Memory DIMM and Rank Sparing | |||
Dynamic CPU and memory migration | |||
MCA-recovery with OS support | |||
最小化宕机时间 | 分区模块化;替换失效组件 | Static System partitioning | |
MCA error logging (CMCI) with OS predictive failure analysis | |||
Physical Memory Board Hot Add/remove | |||
Dynamic/OS Memory On-lining(capacity change) | |||
Physical CPU Board Hot Add/remove | |||
OS CPU on-lining(capacity change) |
由此可见,具有弹性的高可扩展性、结合丰富的RAS特性,让至强7500在关键任务中具备了媲美RISC小型机的能力。再加上更具竞争力的价格,至强7500平台无疑可以成为吸引RISC用户进行迁移的一大利器。如今,至强7500服务器产品已经非常丰富,包括IBM、HP、DELL、富士通、浪潮等国际国内服务器厂商已经纷纷加入至强7500阵营,如IBM X5架构的四路系统System X3850、浪潮八路天梭TS850等,均将目光投入了以往x86所难以企及的关键任务领域。