扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNet至顶网服务器频道 01月27日(文/赵效民):
前言:IBM X6服务器即将并入联想
最近一段时间,服务器领域最大的新闻莫过于,2014年1月23日,IBM与中国联想集团达成协议,由后者出资23亿美元,收购IBM全部的x86服务器资产,包括System x, BladeCenter、Flex System刀片服务器与交换机、x86平台的Flex集成系统、NeXtScale与iDataPlex服务器以及相关软件。此至,IBM将保留的服务器相关资产是:System z 大型主机, PowerSystems服务器, Storage Systems, Power平台的Flex server、PureApplication与PureData appliances。
联想收购的IBM x86资产,包括鼎鼎大名的X架构企业级高端服务器
在联想收购的资产中,就包括刚刚于2014年1月16日,在中国首发的IBM X6服务器。当时,IBM系统与科技部x86和PureSystems解决方案全球总经理Adalio Sanchez先生,亲自来到中国发表开场讲演,宣告经典的IBM X5服务器接班人的降临。然而7天之后,我们都知道,这场发布会成了IBM送给联想的免费宣传。而根据可能的时间表,X6服务器应该会在半年之内跟随IBM System x大部队并入联想,从此成为了联想服务器阵营中最高端的成员。
目前仍在任的,IBM系统与科技部x86和PureSystems解决方案全球总经理Adalio Sanchez先生,不知是否在北京发布会上接受记者采访时,就已经知道X6的可能归宿?
凑巧的是,联想CEO杨元庆在宣布收购计划时,笔者正在撰写X6服务器发布会与采访的文章,写一半时,新闻传来,也由此让我对文章的定位产生了新的想法。以往的种种猜测与疑惑,伴随着这次收购而有了新的设想,也因此改变了这篇文章的原始定位——让我们从X6开始,展望一下联想未来可能的动作如何?
X6的动机:技术在变 负载不变
最近几年,互联网企业在IT领域的话语权有明显增强的趋势,这其中很大的缘由在于云计算这一与互联网有着密系的技术与理念的迅速崛起。也因此,我们会被越来越多的,由互联网企业所倡导的理念所引导,这其中——分布式Scale-Out的基础架构,可谓首当其冲。
前不久网上对于“去IOE”的激烈讨论,就是这一思想与传统IT架构之间最为明显的碰撞。凡事无绝,其实技术架构的变革,对工作负载本身的性质并没有绝对的影响,反过来工作负载的特性往往会决定技术架构的基本走向。比如随着春节的临近,12306网站的售票表现再次引发强烈关注,而一有点风吹草动,也都会往其技术架构上联想。可是随着一些技术讨论的深入,有关12306网站独特的数据更新机制,让我们对其工作负载的特性有了进一步的了解。因此,虽然互联网企业的技术理念总体上更为先进,但它们也必须要面对同样的问题——对于关键负载的承载,尤其是比较特殊的关键负载,是否真的是廉价的双路服务器+Scale-Out的架构就能搞定的呢?显然不是,因此我们仍然有必要重新审视,并保持对于传统的Scale-Up系统的关注,因为无论技术架构如何变迁,与时俱进的Scale-Up系统总会在某些场合比Scale-Out的架构更为适用。这就像在HPC领域,虽然基于MPI的集群架构已经是绝对主流,但OpenMP架构的HPC系统仍然有存在的必要!
有人可能会提到IBM PowerSystems的衰落来引证Scale-Up系统的消亡,但不要忘了,x86本身也在拼命向Scale-Up系统的顶峰前进,为什么?就是因为工作负载不同,数据处理的机制不同,这些种种不同,注定了无论是哪一种技术架构都无法一统天下,而同样的开放与标准化设计(这是用户愿意替换传统相对更封闭的Scale-Up系统的一大主要原因),让x86平台在Scale-Up领域也逐渐拥有了强大的生态环境,并由此具备了与传统Scale-Up系统,如PowerSystems、Oracle SPARC、HP Integrity等抗衡的实力。PowerSystems下滑的市场份额都是被双路x86服务器的Scale-Out方案填补的吗?显然不是,而即使未来全部都是基于云的基础架构,鉴于云的大集中的特性,对于某类负载的单节点承载能力需求,很可能是不降反升,因此这些关键负载节点的能力更强,也更有肋于整体架构效率的提升与成本优化(如能耗、机房空间等)。
X6服务器是x86像高端市场进军的一个产物,而随着相关负载因云集中化的效应不断加重,也将进一步成为这类强调Scale-Up系统的发展动机
我相信,传统的由某些厂商专有的Scale-Up技术架构体系的衰落,有很大一部分由基于开放、标准化的x86高端Scale-Up系统来替代的,而按照市场调研的统计,这其中占据最大份额的就是IBM的X5服务器所占据的,而如今X5迎来了它的接班人X6,继续在云时代里承载更多的关键负载,我们有理由相信,对于这一类负载的刚性需求,将成为x86高端服务器不断发展的连绵动力。
X6服务器总体设计:强调“极速、灵动与弹性”
虽然,X6服务器现在基本上已经算是联想的一员(联想的收购计划还将面临一系列的审查),但这并不影响我们对其本身设计的探讨,从某种角度上讲,它的确代表了x86高端服务器的最新思路,无论归谁,对x86高端服务器来说都有借鉴意义。
X6服务器产品家族,传统机架式产品只有两款,分别是4路/4U的3850 X6与8路/8U的3950 X6,刀片方面,只有用于FlexSystem的x880 X6,可以从双路平滑扩展到8路刀片,而上一代HX5刀片服务器则后继无人,这也可以看出BladeCenter已经逐步停止了更新
IBM对于X6特性的提炼——极速、灵动与弹性,不过我并不认同这样的排序方式
在X6服务器的发布会上,IBM强调了X6所针对的4个应用场景:企业资源规划ERP、业务分析(商业智能)、数据库、虚拟化,在此基础上结合实际使用的需求,突出了三大特性,按IBM在发布会上介绍的先后顺序,分别是极速(Fast)、灵动(Agile)与弹性(Resilient),不过在我看来,仅从创新角度看,灵动应该排在第一,极速第二、弹性第三。因为灵动方面的设计最能代表IBM自己的一种创新,虽然它对于服务器实际使用中的性能影响并不大,但从综合与长远的应用角度来看,它的影响应该是最大的,下面首先让我们以3850X6为例,来看看X6有关灵动的设计。
模块化灵动设计:为X6的综合体验奠定基调
在这一代服务器上,IBM将其在大型主机上的设计元素引入到了x86服务器,其中最重要的就是模块化设计的各种Book(熟悉大型主机的朋友一定不陌生),比如Storage Book(存储模块)、Compute Book(计算模块)、I/O Book(I/O模块)等等,它们最终成就了X6的灵动特性。
3850 X6的外观,根据IBM的估算,其采购成本比HP同级的DL580 Gen8(同样采用E7 v2处理器)低28%
从正面看,3850X6由5个模块(Book)组成,最左侧是存储模块,其余4个带有风扇的则是计算模块(每个模块带有两个风扇),每个模块含有一颗英特尔至强E7 v2处理器(4800或8800系列)与24个DIMM,最大内存容量可达1.5TB(4个计算模块总合6TB,也因此不再需要X5时代的EXA内存扩展单元),每个模块可以单独抽出,就像刀片服务器一样
3850X6的计算模块特写,每个模块前端有两个散热风扇
每个计算模块中,处理器位置最后,在处理器的下方可以看到模块与服务器机箱中板的连接组件,而24个DIMM则分布在模块PCB的两面,可以清晰看出来是8个通道,每个通道3个DIMM,比上一代E7多了一位的通道数量,总DIMM数量也提升1.5倍
处理模块的另一侧
X3850的存储模块,采用双路RAID控制器,支持最高8块2.5英寸SAS硬盘,最高12.8TB,或者是16块1.8英寸eXFlash固态盘,最高6.4TB,同时它还带有用于服务器管控的必要组件,包括服务器状态显示屏、USB以及前置VGA端口
8路/8U的3950 X6服务器就相当于两台3850 X6的融合,但与一代X5服务器是通过QPI线缆外链而组合成3950 X5不同,这次3950 X6的机箱就与3850 X6不一样了。需要从3850X6扩展至3950X6的用户,需要购买新的3950 X6的机箱,但原有的存储与计算模块可以继续使用,不过要注意CPU是否支持8路(E7-4800v2处理器不支持3950 X6的8路扩展),所以有意日后扩展至8路的用户,可以考虑先购买3950 X6的机箱,并先配4个计算模块,并在选择计算模块配置时,一开始就采用E7-8800v2系列。而且3950 X6也支持硬分区,上下两层的计算模块可以划分为两个单独的工作区,互做热备
x880 X6的扩展示意图,由上至下分别是双路、4路与8路形态,它采用的是半宽设计,所以在FlexSystem机箱中是纵向扩展,通过中间的QPI外连总线设计,将2或4个x880 X6节点连接起来,这一设计很像HP的Integrity刀片服务器BL860c i2/870c i2/890c i2所使用的QPI Link
从整体上看,X6服务器深度采用了类似于刀片服务器的模式,将计算单元、存储单元通过一个统一的机箱中板进行互联,就像是一个特殊的刀片服务器,事实上,你完全可以将这些模块称为“存储刀片”与“计算刀片”。在I/O模块与机箱整体设计方面,X6也是如此,能明显看到刀片服务器的设计理念。
3850 X6服务器的背面示意图,非常清晰明了,所有的I/O模块均与中板相接,为前端的计算模块提供I/O资源
每个模块也都可以无工具拆解出来,便于升级与维护
主(标配)I/O模块提供了服务器集成管理模组(IMM,Integrated Management Module)、3个PCIe 3.0x16插槽,以及板载LOM、USB、VGA万兆网卡以及FC接口和VGA端口
除了主I/O模块之外,还有两款选配的I/O模块,均可热插拔,左侧是半长款,配置1个PCIe 3.0x16+2个PCIe 3.0x8插槽,右侧是全长款,插槽配置与半长款相同,主要是应对全长的PCIe卡而设计,比如对电力需求达300W或更高的专业GPU图形卡
半长款选配I/O模块特写
3850 X6所配的电源模块(最多4个)由EMERSON(艾默生)提供,适应电压范围100V-240V,在中国的应用环境下,最高总输出功率1400W
借助于无工具拆解设计,维护人员可以很轻松的进行模块拆卸与更换,这就意味着——日后如果英特尔进行E7的升级,只需要更换计算模块即可,而不用更新整个服务器,大大节省了升级投资。在设计规划中,X6承诺支持3代的计算模块升级,按E7的更新周期约3年计算,3850 X6与3950 X6的机箱可坚持使用近10年而不落伍。由此可见,与大家所熟悉的刀片服务器相对应,X6在整体构思上,可谓是异曲同工。
此外,这种模块化的设计,也使得每个模块可以获得更大的创新空间,将它们聚合在一起,就形成了服务器整体的特色,所以我认为X6服务器的模块化设计,为其在生命周期里,带给用户的整体综合使用体验奠定了基调,比某一些方面的新技术采用,具有更为重要的意义。
内存总线上的闪存:为极速数据处理提供保证
这次在X6服务器上,特别强调了极速,IBM将其放在了最前面介绍,这也看出其对这一特性的重视与信心。对于X6这种级别的服务器来讲,IBM所强调的4个应用场景:企业资源规划ERP、业务分析(商业智能)、数据库、虚拟化,无疑是X6所承担负载中的重点,而它们无一例外都需要更强大的性能,而在目前的服务器架构中,造成瓶颈的往往是数据I/O层面——数据存储设备与联网设备,不过对于Scale-Up系统来说,显然数据存储设备是改造重点(对于分布式系统来说,联网性能相对更重要)——X6在极速方面的表现也源于此。
X6服务器的极速特性
X6在极速方面所做的最大运作,就是采用了可直接安装于DDR3-DIMM插槽的闪存模组,来实现更高的数据I/O带宽以及更低的延迟响应,这一产品在IBM体系下与1.8英寸固态盘同属eXFlash家族,名为:eXFlash DIMMs。不过,它并不是IBM独有的技术,而是源自于SanDisk公司的UltraDIMM技术(最早由SmartStorge System开发,后被SanDisk收购)。简单来说,UltraDIMM技术就是让NAND闪存模组具备标准的DDR3内存接口,通过DIMM上的控制器,实现DDR3内存总线与NAND闪存存取总线的桥接,从而可以直接插在DDR3 DIMM(必须支持Registered DIMM)插槽上,由内存控制器直接访问,在保证更高带宽的同时(想想DDR3的总线速度),更大幅度降低了响应延迟。
来自SanDisk的Ultra DIMM技术,采用MLC闪存芯片,可做到200GB与400GB两种容量,持续读取与写入带宽分别可达1000MB/s与760MB/s,读潜伏期150微秒,写潜伏期小于5微秒,IOPS性能可达150K读/65K写(4KB随机)
在3850 X6服务器中,共可安装32条eXFlash DIMM(系统总共有96个DIMM插槽,每个计算模块24个),最大容量12.8TB(使用400GB的eXFlash DIMM时)。不过,Adalio Sanchez表示,现在这个规格只是经过稳定测试之后的配置,理论上可以装载95条eXFlash DIMM,留出一条安装传统DDR3内存用于系统的启动。所以,32条的eXFlash DIMM并非上限,随着后续的系统更新,肯定还会增加。
在性能表现方面,据根据IBM自己的测试,eXFlash DIMM在写潜伏期方面的表现最好,可达15-10 μs,而PCIe闪存卡的鼻祖Fusion IO产品的水平则在15-19 μs 之间,至于传统的SSD固态盘,则在65μs左右。而在32条eXFlash DIMM满配情况下,IOPS的性能可达1000万次的随机读与400万次的随机写。
不过,eXFlash DIMM是源于SanDisk的UltraDIMM技术,而后者并非专供IBM独家使用,这也就意味着其他服务器厂商只要愿意,同样可以采用eXFlash DIMM来实现极速的表现。对此,Adalio Sanchez并没有否认,但它强调了在这一技术背后需要有强大的软件管理功能的支持,而这也将体现出IBM的独到之处——它就是IBM FlashCache Storage Accelerator(FCSA,闪存缓存存储加速器)。
IBM的FCSA是一个管理软件,主要作用就是识别并管理系统中的闪存存储,用于全局的数据缓存,从而针对相关应用起到加速器的作用。FCSA部署在虚拟化层(目前只支持VMware)或操作系统之上(Windows或Linux),向上接收应用的数据请求,向下管理不同的存储设备。
IBM FlashCache Storage Accelerator(FCSA,闪存缓存存储加速器)在系统中所处的位置
在实际使用中,FCSA起到了一个数据中介的作用,它先识别系统中的闪存设备(对于IBM服务器来说,就是eXFlash),然后将其作为全局存储的缓存来使用,其服务的对象就是主存储设备,包括SAS、NAS、FC、iSCSI等等。FCSA的关键作用就在于提高闪存缓存的数据命中率——在应用数据写入时,同时向主存储和闪存中写入,而当读取时,先在闪存中查找,如果命中,则直接从闪存中读取,如果没有命中,则从主存储中读取,并同时在闪存中生成一个拷贝,如果下次再读取相同的数据,就会在闪存中“命中”,不用再惊动主存储。
eXFlash DIMM其实只是IBM闪存应用整体创新中的一环,它离不开控制层面的协同,而这也将体现IBM在闪存应用方面的整体独特性
显然,FCSA所管理的缓存的命中率,将极大影响闪存的实际使用效果,而从CPU与硬盘的缓存设计中,就可以想像出其中的难度,所以IBM强调FCSA与eXFlash DIMM的组合才是IBM的独有创新,是有道理的,而FCSA也将直接决定这种基于UltraDIMM技术的闪存DIMM普及后,各厂商产品的性能差异化。
弹性的容错设计:保证关键业务系统的高可用
对于将Resilient一词翻译为“弹性”,可能并不符合大多数人的认知,事实上Resilient更多的是强调“回弹性”与“复原力”,比如肌肉的回弹性与复原能力就代表着它的健康与强壮程度。在X6身上,我们也同样可以这么理解——它体现了X6在极端状态下的系统复原能力,在原有的RAS(可靠、可用、可维护)范畴之外又有所延展,显然它是保证应用高可用的必要前提。
X6上的很多容错设计与扩展能力源于至强E7本身的特性(比如3倍的内存),但仍有一些属于IBM自己的创新,主要体现在系统层面上的容错与可维护性方面
在3850的存储模块上集成有IBM故障前兆分析(PFA,Predictive Failure Analysis)组件。它对服务器内关键的子系统进行监测,在可能发生故障之前,提醒管理员进行更换。配合X6和灵动设计架构,让这一维护操作更为便利,从而有效保证了服务器本身的可用性。此外,还有IBM已经久经考验的光通路诊断功能(LPD,Light Path Diagnostics)。LPD通过存储模块上的LCD显示屏来提示管理人员当前服务器的工作状态,并在几秒之内即可给出诊断信息。
3850 X6上的LPD显示屏
在部件发生故障,系统“复原”能力方面,X6提供了CPU、内存与I/O适配器失效备援的能力——当负责系统启动的主CPU失效时,服务器的BIOS会自动切换至其他CPU完成系统的启动;借助IBM的Chipkill与E7 v2自己的双芯片数据校正能力(DDDC,Double Device Data Correction),X6服务器可承受两颗连续的内存芯片失效,而不会影响系统的性能;借助模块化的I/O设计,6个选配的PCIe插槽可以进行热插拔,即在服务器工作时,轻松进行PCIe适配器或选配I/O模块的替换工作(主I/O模块上除了风扇外,其余组件并不支持热插拔)。
在这里的确要再次强调X6的模块化设计,它使得传统的机架服务器获得了类似于刀片服务器“无顶盖”的可维护能力。X6服务器无需从机架中取出来,即可对主要的模块进行替换,如计算、存储、I/O等,这对于提升可维护性有着重要帮助。
展望:摆脱束缚 向老东家宣战
平心而论,IBM的高端x86服务器的确是有自己独到之处的,从2001年第一代所谓IBM X-Architecture高端(这里的高端意指4路及以上)服务器诞生之日起,其在x86领域里的创新能力就有目共睹。不过,由于IBM自身的POWER服务器平台的因素,总让人感觉IBM x86服务器团队并没有尽情的发挥出其应有的能力。而这一切,很有可能在联想收购IBM x86业务之后发生根本改变,至少笔者希望如此。
IBM X-Architecture高端服务器的发展历程
作为企业级IT媒体的记者,我能深刻感受到IBM在POWER平台与x86平台之间的纠结。由于POWER是IBM独家的资产,而x86其实是业界标准化的开放平台,主导权在英特尔与AMD(前者占有绝对优势)手里,所以IBM的这种纠结是可以理解的。一方面,x86的势力不范围不断增大,在越来越多的应用领域占据了统治地位,IBM也不愿意放弃这些市场,但随着x86自身能力的不断增强,它也正不断占领原本是POWER服务器的地盘。随时代发展的IBM x86服务器不能丧失市场的竞争力,但如果竞争力太强,又会更影响到自家兄弟的生意,虽然从IBM整体上看,最多是钱从左右倒右手的结果,不过对于POWER业务部门来讲,则有着切肤之痛。所以,IBM x86部门的实力也不可能完全施展出来,这不仅仅表现于市场宣传层面,从产品技术变革方面也能看出来。
比如第一代X-Architecture高端服务器X440,就可以做到16路的扩展能力,第二代的x445则可扩展到32路(当时英特尔至强MP的官方方案最多只到4路)。但在此之后,多路能力就不再是IBM所强调的了。尤其是当采用Nehalem架构的新一代至强7500发布后,基于它研发的X5服务器最高扩展路数只到8路,但理论上讲英特尔的QPI互联架构提供了很大的级联灵活性,SGI就推出了最高256路的系统Altix UV 1000。在2010年8月X5中国发布会上,笔者也曾就此(为什么不推出8路以上系统?)询问过Adalio Sanchez,他当时表示,借助于EXA扩展节点,理论上完全可以支持8路以上的扩展,但基于市场需求的判断,IBM觉得没有推出8路以上x86服务器的必要。
是8路以上服务器没必要,还是8路以上的x86服务器没必要?我认为在IBM看来,显然是后者,否则PowerSystems为什么还会有780、795的推出呢?这里就透露出一个IBM组织内部的分界线——8路以上市场,x86别碰,那是PowerSystems的领地。
所以,我总觉得IBM x86团队的实力与野心被IBM自己束缚住了,就x86本身而言,IBM完全有技术实力可以做到32路甚至更强大的系统,但从IBM整体而言,尤其从自身的POWER业务出发,IBM至少不希望是自家兄弟挖自家墙角这么积极。然而,随着1月23日的新闻发布,x86部门将会并入联想集团,拥有7500名正式员工+1500名合同工的x86团队的能量是否能就此释放,并向PowerSystems宣战呢?我认为,这是必然的!
x86继续向高端进军的步伐不可能停下甚至放慢,而一些有实力的厂商也早就开始布局8路以上的大系统研发,最快今年就能看到成果。例如惠普著名的“奥德赛”计划,它将基于现有的Superdome 2与BL8xx刀片服务器进行至强E7的换装改造并辅以软件层面的配合与支持,相关的服务器代号分别为“DragonHawk”与“HydraLynx”,前者最早可扩展至32路,后者则是8路。据可靠消息,该计划的第一款产品将于2014年年中推出。在国内,浪潮公司也已经明确表示,继采用安腾服务器的32路天梭K1之后,将会把研发重点放在至强平台上,也就是说下一代的天梭将很可能是32路至强E7的系统。
可以想像一下,将安腾处理器换成至强E7的HP Superdome 2服务器(代号DragonHawk),会对关键业务市场带来怎样的冲击
因此,x86与PowerSystems的攻防战并不会因为IBM卖掉x86有丝毫的改变,只是IBM自己失去了一道屏障而已——以前即使客户转向x86,也有可能是自家兄弟得到生意,但以后肯定是竞争对手了。联想收购IBM x86服务器并不是想给IBM当清道夫,当双方微笑完成x86部门交接合约之后,X6必然将成为联想攻占PowerSystems领地的先锋,并且那时的它将毫无牵挂,全力以赴——也许现在IBM x86部门的某些人就憋着这股劲呢。事实上,近年来我们可以看到IBM x86团队的创新似乎要强过POWER团队,更大容量的内存扩展能力、对闪存的使用(包括FCSA闪存管理软件,它只支持x86平台)、模块化的设计等等,都走在了同级PowerSystems的前面。
再往后,我完全有理由相信X6的接班人将会进军8路以上市场,否则那就是HP以及浪潮等公司的天下,以联想或IBM x86团队的性格应该不允许这种情况发生。届时,由IBM亲自培养出来的X-Architecture研发团队,很可能将成为其老东家最为头疼的对手……总之,我期待更为强大的联想X-Architecture服务器的到来!