扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
一提起小型机(Small Computer)给人的感觉往往是很高端的。从计算的发展历史来看,小型机也的确资格更老,而且所采用的操作系统以及处理器也更为高端,因此小型机还有另一个名字——UNIX服务器。在如今Windows与Linux盛行的年代,估计见过UNIX系统界面的人也越来越少了。所以,长久以来,UNIX服务器也好,小型机也罢,对于很多企业用户来讲,都代表着一种神秘与一种高不可攀。事实上,这种印象至今仍然没有太大的改观,而且小型机的发展则呈现出某种疲态。
小型机由于历史的原因,其使用的处理器基本上是厂商自有的,操作系统也基本上是处理器厂商自己开发的,这与现在的采用x86处理器开放架构的服务器(硬件基本上是通用而统一的,操作系统也是通用的)完全不一样,小型机厂商通过专有的硬件与架构来维护与垄断自己的市场,但是这个市场的大小也直接关系到了专有硬件的市场规模,进而影响到最终的成本。由于厂商可以按照自己的心意去定制服务器的硬件与操作系统,并进行针对性的优化,所以传统的观点认为,小型机的性能往往要比通用性更高的x86服务器强很多。这样一来,有实力的厂商都有着辉煌的小型机生产历史,延续至今,著名的小型机厂商仍然有三家,即IBM、HP(惠普)与Sun(目前已经被Oracle收购)。在这其中,IBM的小型机显然是最著名也是最有活力的,根据Gartner的数据,2009年第三季度IBM占据了42%的UNIX服务器收入市场份额,IDC的数据则是IBM占据了39.5%的份额,HP为29.2%。
我们首先来看看IBM服务器体系的划分,这虽然代表了IBM对自身产品线的定位。但也体现了小型机在当今市场上所处的位置。
IBM是目前唯一一个真正能提供大型主机、小型机与PC通用型服务器的厂商,而若以一个金字塔的结构来划分,就如上图所示。在这里可以看出小型机在IBM的服务器版图中的重要性,而这也是所有小型机所存在的市场,它填补了低端x86服务器与最高端大型主机之间的空缺。为此,IBM也进行着不懈的努力。就以小型机的精髓与个性的代表者——POWER处理器来说,从最早的确定RISC指令架构体系,到今天已经走过了20个年头,是当今CPU领域中不可忽视的重要力量。
POWER处理器的发展历史,20年之后,Power仍然保持着旺盛的生命力,而每一代POWER处理器的发布都能带动处理器技术的发展
这里需要指出的是,POWER处理器采用的Power架构并不是企业级专用的处理器架构,比如早期苹果公司所生产的MAC电脑所采用的PowerPC处理器、现在正在热卖的PS3、Wii与Xbox 360游戏机所采用的处理器以及很多嵌入式设备所采用的处理器都是基于Power架构。而Power一词本身则是一个缩写,理应全是大写,即POWER,它的含义是Performance Optimization With Enhanced RISC——基于增强型RISC的性能优化处理器,但这一缩写与英文“力量、能量”的Power拼写相同,所以到今天很多场合也都是大小写不分了,不过倒也贴切。
提到苹果的MAC机以及电视游戏机,肯定不会让人们产生高端的印象,这就说明了一个道理。处理器的架构本身并没有高低贵贱之分,就看你怎么去发挥和利用了,你当然可以单打独斗,垄断自己的专属领地,也可以联合业界的力量,走开放平台的道路。x86走的就是开放式的路线,英特尔也为自己的处理器开发了所谓的英特尔架构(IA),而POWER则属于IBM自己,除了IBM之外基本没有其他厂商在用这款处理器,也没有其他厂商的处理器兼容POWER架构的指令。渐渐的,基于POWER架构的处理器逐渐脱离开了我们熟悉的PC与低端服务器领域,并在小型机市场站住了脚跟,从而给人留下了一个“高高在上”的形象,但这真的有点冤。从上述那些广阔的应用案例来看,POWER处理器家族绝对可以算是处理器中“高低通吃”的佼佼者。
其实从应用的角度上来说,小型机与其他的服务器没有两样,只是处理器架构不一样,操作系统不一样而已,所以从应用处理的层面上去看小型机,它并不神秘,它更多的只是一款从硬件和软件配置上相对特殊的服务器,尤其是在当前以应该为导向的,基于虚拟化的IT架构中,小型机也只是处理企业应用中的普通一员,归根结底还是要体现在性能与RAS特性方面。
前面说过,在IBM的服务器体系划分中,按单机性能来看,小型机理应在PC服务器之上,这一点POWER处理器的确做得不错。由于可以从CPU到整机的定制化,所以IBM在小型机市场上的经验也帮助了它可以在很长一段时间里,凭借着自己的实力领先于业界,比如1997年著名的人机“国际象棋”对抗赛。
IBM的Power家族有着辉煌的历史,1997年5月11日,国际象棋世界冠军卡斯帕罗夫与IBM公司的国际象棋电脑“深蓝”(Deep Blue,采用POWER2 SC处理器)的六局对抗赛降下帷幕。在前五局以2.5对2.5打平的情况下,卡斯帕罗夫在第六盘决胜局中仅走了19步就向“深蓝”拱手称臣
1997年5月11日对于IBM的POWER小型机(当时名为深蓝)来说,是一个历史时刻,号称人类最聪明的人——国际象棋大师卡斯帕罗夫败在了深蓝的手下,而在当时PC服务器完全不具备这样的计算能力,这可以说是小型机在性能上强于PC服务器的最佳例证。
然而,时过境迁。小型机如今的生存状况早已不能与十几年前同日而语,这其中所遇到的最大挑战就来自x86服务器。从上面的金字塔来看,小型机性能再提高,去冲击大型机市场意义并不大,可下面的x86服务器的性能提升则对小型机形成了巨大的压力。随着英特尔、AMD两家厂商的技术与实力的不断提升,x86处理器在性能上可谓突飞猛进。很多原本只在小型机上才有的技术已经越来越多的出现在了x86处理器上,比如64位技术、虚拟化技术、多线程技术、多核心技术甚至高RAS(Reliability, Availability and Serviceability,可靠性、可用性与可维护性)特性等等。我们也讲过,处理器的架构不同,并不是最重要的,它无所谓高端与低端,关键还在于性能、成本,这也关系到了市场规模,进而左右应用开发的规模,这反过来也决定了你的生态环境是健康的循环生长,还是恶性的循环消亡。在这个过程中,我们看到了UNIX的变种——廉价Linux的兴起,这在很大程度上提高了x86服务器的健壮性,而随之而来就是Linux上的企业级应用迅速增多,传统的著名的企业应用软件都有了Linux版本,再配合x86系统硬件上的提升,对于小型机市场的冲击也就可想而知了。
IBM认为在小型机领域,IBM相对于竞争对手有着明确的优势,尤其是在软件、虚拟化方案方面,IBM自成一体,这也是为什么虽然受到市场上的不利冲击,但IBM仍然保持着小型机市场头把交椅的根本原因
就目前而言,虽然小型机在销售额上仍然占据着服务器总市场的30%左右的份额,但已经逐年走低,这从另一个侧面也证明了小型机给用户的那种“高高在上”的感觉没有错,因为这本身也是一种被边缘化的体现。另一方面,小型机究竟还有多少应用价值、采购小型机还值不值得,已经成为很多小型机用户所关注的话题。所以小型机虽拥有辉煌的历史,但却处在一个越来越严峻的生存环境中,即使是小型机的领头羊——IBM的Power系列小型机也不例外。
英特尔在2009年3月发布至强5500处理器时给出的与小型机的性能、成本对比数据,其中Sun的T5240采用的是两颗1.4GHz的UltraSPARC T2 Plus处理器(8核心/64线程,双插槽共16核心/128线程)+32GB内存,IBM的P570采用的是两颗4.7GHz的Power6处理器(2核心/4线程,双插槽共4核心/8线程)+32GB内存,至强5500系统则是双至强X5570(2.93GHz)+32GB内存
2009年,应该是Power小型机所受到最大冲击的一年,根据Gartner公司的数据,UNIX服务器的收入所占的市场份额,从2009年第一季度的32%下降到了第三季度的27%,来自IDC的数据则显示,相对于2008年第三季度,2009年第三季度UNIX服务器的销售收入下降了23.4%,只有28亿美元。而在这一年里,英特尔推出了具有革命性意义的全新一代处理器至强5500,这款基于最新的Nehalem架构的处理器,在性能提升幅度方面是惊人的。而在至强5500的发布会上,英特尔拿出了与Sun和IBM的双插槽小型机的性能对比数据,让人看到了小型机至少在性能上已经不再像当初挑战国际象棋冠军那个时候,根本不把x86放在眼里。其实,很多人都可以感觉得到,小型机在性能上的优势越来越多的是以高扩展性来体现,而在打动用户方面,也更多的是以RAS特性为主,就单CPU而言,小型机处理器对阵顶级的x86处理器,已经没有完胜的把握,而且像Nehalem这种优秀的架构也在向多插槽系统迈进。
这似乎与原先的那种按性能档次的划分规则有了一些矛盾,过多的强调RAS反而给人一种顾此失彼的感觉。因此,市场上也急需一款新的小型机处理器来强化小型机的地位,并“以正视听”,也就在这个时候,IBM的POWER7来了!
POWER7处理器概览
如果仔细查看POWER处理器的发展史,就可以看出其中的规律,自从具有划时代意义的POWER4处理器诞生之后,基本上每3年IBM就会发布新一代的POWER处理器。而从POWER7的身上,我们能看到自POWER4以来一脉相传的沿革。
从2001年的POWER4至今年的POWER7,我们能到POWER处理器的发展沿革,而在底层上,一直保持着二进制的软件兼容性
POWER4是第一个实现多核心设计的处理器,虽然今天多核心处理器早已成为主流,但POWER处理器的前瞻性设计仍然不容质疑,而在POWER4之后,均是双核心的设计,在POWER5身上,IBM实现了多线程设计(SMT),而到了POWER6则大幅度提升了主频,并进一步强化了浮点与虚拟化性能。而到了POWER7,核心数量猛然提升至8个,核心的多线程数量也提升至4个,仅从这一点就意味着性能的巨大提升。
POWER7实现了多线程的跨越式发展
POWER7具备智能超线程的功能,可在单线程/双线程/4线程之间,根据性能需求进行智能切换,不过这种单核心多线程的模式,并不能像物理核心那样大幅度提高处理性能,在双线程下,性能较单线程提升1.5倍,而在4线程模式下,性能提升则为1.8倍,接近于两个物理核心的性能
从2004年的POWER5开始,IBM就引入了单核心双线程的设计,32插槽时系统的总线程数量可达128个,而如今单核心4线程的POWER7将32插槽系统的线程总量提升至了1024个。不过,由于只是逻辑线程数量的提高,所以在实际性能表现方面,并不能寄予太高的希望,IBM给出的数据还是比较客观合理的。
生产工艺的进步也让POWER处理器的设计不断攀上更高的高峰
POWER7另一个引人瞩目的地方就是先进的生产工艺,它是唯一一个采用45nm的小型机处理器,即使是已经推出了32nm的处理器的英特尔最新的“安腾3”也仍然是65nm的工艺,只是2007年POWER6的水平。
POWER7处理器的基本特性,片上32MB eDRAM缓存以及新一代的内存与I/O架构可谓是一大亮点
再来看看POWER7的内部设计,除了多核心与多线程外,片上32MB eDRAM缓存与新一代的内存及I/O架构设计也体现出了与POWER6的很大的不同。片上的缓存相对于POWER6的片外设计,进一步保证了延迟性能,而新一代的内存控制器和I/O设计也保证了多核心下有更充足的数据带宽可用,这对于最终的性能表现是至关重要的。
POWER7处理器的处理核心设计
在处理器内部的核心单元上,POWER7也做了不少的改动,它具备两个定点单元、两个存取单元、4个双精度浮点单元、一个向量单元、一个分支预测单元、一个状态寄存器、一个十进制浮点单元,一共12个执行单元,不过L1与L2缓存相较POWER6则有了明显的降低。
POWER7的晶圆,对照上面的结构图,可以看出8个核心
POWER7的芯片和有机封装、陶瓷封装(右边两个)外形,此外还有一种多芯片模组封装(MCM),不过现在还没有产品出来,IBM也没有给出明确的时间表,但应该在2010年年内推出
从这张相片中,我们能看到陶瓷封装的POWER7底部与插槽设计
看完POWER的基本特性,我们可以再看看POWER6以加深一下对比。
POWER6的处理器与核心设计
POWER6处理器的的晶体管数量为7.9亿个,为双核心双线程设计,每个核心中的执行单元数量为9个,主要比POWER7少了3个双精度浮点单元,因此POWER7的浮点运算能力相较POWER6有了很大的提升。最后我们可以用下表做一个总结。
从总体上讲,POWER7可以算是POWER6的多核心加强版,并将周边的内存与I/O架构一并提升。而在下文中,我们将有针对性的介绍POWER7具体的新特性,进一步深入了解POWER7。
POWER7的缓存与内存架构设计内存与缓存对于处理器的性能有着重要的作用,基本上第一代新处理器都会在这两点上做文章,而POWER7在这方面的改进也非常大。
IBM对于eDRAM比较偏爱,在IBM看来,eDRAM在性能、带宽、能耗方面达到了一种理想的平衡,它的性能(带宽、延迟)虽然不如SRAM,但所需的晶体管数量也要少很多,所以在能耗与成本方面也更为出色。因此,可以在有限的晶体管数量下,提供更大的缓存容量和更平衡的表现
在POWER7之前,POWER4/5/6也是采用了eDRAM三级缓存,但是在片外的,并不与处理核心融为一体。而随着CPU核心数量的提升,CPU插槽的引脚数量已经很难满足CPU核心与片外的缓存相连,因此这次在POWER7中,将eDRAM三级缓存移到了芯片内部,从而也成为了首个使用片内eDRAM三级缓存的处理器。
POWER7处理器的芯片结构布局,每个核心都有专属L3缓存(Fast L3 Region),容量4MB
POWER7的L3缓存设计,IBM采用了一种被称为Fluid(流动)的混合L3缓存结构
eDRAM的性能介于传统的SRAM缓存与SDRAM内存之间,延迟性能比本地内存低3倍,不过IBM为POWER7的每个核心都划定了自己的专属L3缓存区,即Fast Local L3 Region,这个区域的容量为4MB,8个核心正好是32MB。每个核心访问自己的专属缓存里的延迟比整体的L3缓存延迟还要低5倍,并且L3缓存中的容量可以根据情况迅速的克隆至多个核心的专属区,以方便多核心的共享访问。
POWER7的L3缓存也可以在某种情况下被单个核心所独享
POWER7的三级缓存的另一个特点就是,每个核心虽然有自己的专属缓存区,但当有些核心未使用时,它们所对应的专属缓存区将会共享,如果只有一个核心工作,那就意味着它的L3缓存将达到32MB的容量。当然,访问自有专属缓存区之外的三级缓存的速度将会降低,但容量的增加是不可比拟的。
谈完L3缓存,再来看看L2缓存。与POWER6相比,POWER7的L2缓存的容量只有它的1/16,不过按IBM的说法它非常的快。而且L3缓存本身就在片上,而POWER6的L3缓存在片外,工作主频是POWER6主频的一半,所以里外对比,POWER7的L3缓存的效率显然更高,这也让L2缓存的压力大大降低。
POWER7的整体缓存设计
POWER7中的L2缓存(L2 Turbo Cache)的延迟比每个核心专属的L3缓存还要低3倍,将有效的降低L3缓存的功耗并提高性能,而从总体的缓存设计上,我们能看出来,只有到了POWER7这一代,才真正开始了传统快速SRAM与eDRAM在缓存架构中的平滑结合
POWER7的内存架构设计
POWER7的内存采用了业界主流的DDR3内存,CPU内置两个内存控制器,不过内存控制器并不是与内存DIMM直接打交道,而是通过一个高级缓冲芯片(ABC,Advanced Buffer Chip)访问DDR3内存,每个控制器有4个ABC通道。这个ABC有点类似于FB-DIMM上的高级内存缓冲器(AMB),与内存控制器之间应该是以串行总线相连,每个通道的数据位宽是16bit,传输率为6.4GT/s,这样8个通道的数据带宽就是102.4GB/s。而ABC也对应着8个DDR3通道,最高规格为DDR3-1600,目前来看,每个DDR3通道可容纳最多4条DIMM,以DDR3-1600计算,8个通道的带宽也正好是102.4GB/s,但是可能是由于ABC的限制,目前只支持到DDR3-1066MHz,总带宽为68.2GB/s。在容量方面,以单DIMM 8GB的容量计算,单颗POWER7的内存容量为256GB,平均每核心32GB。与POWER6相比,POWER7的内存带宽提高了一倍(POWER6最高支持DDR2-800),不过由于POWER7的核心数量提高,所以相对于POWER6每核心最多48GB的内存容量,有所降低。
另外,POWER7的内存架构也支持高级的电源管理和RAS特性,这一点将在下文进一步介绍。
POWER7的能耗管理设计很多不太了解小型机的人,可能光从名称上就会觉得小型机应该会更耗电,但事实上,与x86服务器处理器的发展历史一样,POWER处理器一直没有停止过对低功耗以及智能功耗控制的追求,甚至很多设计上,你能发现有很多似曾相识的地方。
POWER7在能耗管理方面下了很多功夫,主要集中在了Sleep与Nap模式上
首先,IBM为POWER7设定了三种睡眠模式,而其中的重点在于Sleep与Nap模式上,我们可以理解为“中眠”与“浅眠”模式,在Nap(浅眠)模式下,POWER7看重的重新唤醒进的响应速度,在此状态下将关闭执行单元的时钟,降低核心的频率,但同时仍然保持缓存与TLB的关联以备快速的唤醒,而在Sleep(中眠)模式下,将清空缓存与TLB,关闭所有的核心与缓存的时钟,降低电压等以进一步节省电力。
POWER7采用了自适应的电源管理技术Energy Scale
其次,在POWER7进入工作状态后,IBM还引入了Energy Scale电源管理技术,它的功能很像英特尔在Nehalem架构处理器上采用的睿频(TurboBoost)技术。Energy Scale可以精确的调整与优化性能功耗比,其中动态电压与频率锁定(DVFS,Dynamic Voltage and Frequency Slewing)技术可以在-50%至10%的范围间单独调整每个核心的运行频率,而调整的依据有两个,即工作流与CPU占用率,以及片上活跃度监控器。由此,POWER7具备了Turbo模式(即TurboCore),它可以根据工作流负载与空闲核心的情况将相应的工作核心的频率提升10%以提高系统的性能。另外,Energy Scale还允许对处理器和内存的功耗进行独立的调节,POWER7采用了实时的硬件性能监控器以及片上电源逻辑装置来为调节提供环境与状态依据。最后,Energy Scale还支持能源封顶的策略,可以根据系统中不同部门的能源需求来设定各自的能源封顶策略。
POWER7的RAS特性本文的开头曾经讲过,在很多场合小型机所宣扬的优势中,高RAS特性是必不可少的。也因此,虽然x86处理器的性能追上来的很快,很多应用也都有x86平台的版本,可在RAS方面,却一直是小型机的绝对强项。因此,在那些需要高RAS特性的应用场合,小型机仍然不可替代。从某种角度上讲,RAS特性已经成为了小型机与x86服务器之间的分水岭。x86如果想继续上位,就必须具备,而小型机如果想继续自己的好日子,就必须更上一层楼。
不过,说到RAS特性,并不仅仅是CPU或是硬件的事情,其实就一个应用本身来讲,RAS贯穿全局,CPU只占其中一部分。比如操作系统就是一个很重要的RAS节点,所以小型机的RAS体系并不是那么很容易就可复制的,它是成系统并成体系的,所以在谈POWER7的RAS特性之前,有必要看看硬件以外的对比。
从服务顺操作系统层面来看,IBM的AIX操作系统的宕机时间最少
根据美国Yankee Group在2007-2008年所做的服务器操作系统的评估调查,来自27年国家的400多个企业的反馈显示,IBM的AIX操作系统的宕机时间最少,显示出了高可靠与高稳定性。这对于企业应用中的整体RAS表现显然很重要。这其中可以看出SUSE的Linux系统也很可靠,而它也能应用于x86系统,那么以整体的平台来看RAS又如何呢?
从整体的系统层面来看,IBM的Power系统全年宕机时间最少,HP-UX/RISC的系统其次,x86/Windows平台最高
在《网络世界》于2009年7月14日发布的服务器操作系统系统可靠性调查中,发现Power+AIX的组合表现最为稳定可靠,在可用性方面是Windows系统的10倍,是UNIX友商的2.3倍,在可靠性方面,每年Power+AIX只有不到一次的非计划内的中断服务,在可维护性方面,11分钟即可完成补丁的升级。综合来看,Power+AIX系统在RAS方面有着良好的传统和优异的表现纪录。
POWER7的高可靠与高可用设计,毕竟对于CPU来说,并不涉及高可维护性,后者是对整体系统而言
回到本文的主题,POWER7在高可靠与高可用性方面,包括了以下主要的设计:
动态双振荡器:有两个振荡器为处理器提供基准时钟(OSC0和OSC1)的失效备援
高可靠的处理器与节点总线接口:具有ECC保护与节点热添加与修复功能的Fabric架构总线接口,用于连接其他的处理器或节点
处理核心恢复:检测各主要寄存器的错误,并进行清除与重试,增加堆栈闭锁功能以改善软件错误率(SER)
后备处理器恢复:核心检查停止时进行分区隔离
L3 eDRAM缓存:具备ECC保护功能、特殊的无法修正的错误(SUE,Special Uncorrectable Error)应急处理、缓存行删除以及备用的行与列寻址功能
GX IO总线:用于与IO集线器相连接,具备ECC保护以及热添加
高能内存功能:具备标准的ECC/Chip Kill内存技术;可允许两个内存芯片失效;SUE应用处理;选择性的内存镜像功能用以在DIMM失效时进行分区恢复;PowerVM虚拟化管理器也具备全DIMM失效时的保护功能
从中我们可以看到,有些RAS特性已经与相应的软件相结合,比如PowerVM虚拟化管理器,而在虚拟化已经基本成为小型机主要的应用模式之后,虚拟化RAS显然也必须提到台面上来,在这方面POWER小型机显然走在了前面。
POWER7的特点总结与市场目标在介绍完POWER7的总体状况与一些细节设计之后,我们可以再来总结一下POWER7处理器以及由其组成的系统,再来看看它所针对的市场目标。
POWER7的处理器单元模组与POWER7系统的基本特性总结
POWER7的总带宽,请注意这里的带宽是指原始带宽,而不是数据带宽,原始带宽包括了用户数据带宽以及辅助数据(如ECC、同步等信号带宽)
POWER6处理器的总和带宽
在IBM看来,POWER系统仍然在健康的发展,而POWER7相对于POWER6有着明显的变化和进步。从处理器的总和带宽方面来看,POWER7比POWER6有了明显的提升,当然这也是核心数量增加到8个之后的必然举措,从这点来看,虽然总带宽提高到了POWER6的两倍多(POWER6的L3缓存带宽不算),不过若以核心数量来分摊的话,POWER7其实并不占优,不过由于核心自身性能的提高,再加上L3缓存设计的改进,所以在综合性能上,POWER7的表现仍然让人眼前一亮。
POWER7处理器与POWER6处理器的核心与CPU性能对比
在性能方面,POWER7让POWER系统在3年后迎来了巨大的性能提升。从IBM给出的数据来看,单核心性能,POWER7的单核心性能约是POWER6的1.3(整数运算与商业应用性能)至1.5倍(浮点运算性能),前者应该与4线程的设计有很大关系,后者则利益于POWER7核心的浮点单元与单周期的浮点运算能力有明显增强。而以整体的CPU性能来看,POWER7大约是POWER6的4倍多,这也与核心数量的差距相匹配。
POWER7的重点特性总结
现在我们基本上可以对POWER7的特性做一个总结了,IBM所提炼出来的POWER7突出优势/特点主要有以下几个方面:
TurboCore模式:可以为数据库应用将核心的性能发挥到极致,最高可提升核心频率达10%(注:该功能目前仅在Power 780服务器上可用)
MaxCore模式:这个模式可以与TurboCore模式相切换,当需要更多的核心与线程参与应用的执行时,就采用这一模式。MaxCore模式下,核心的运行频率不如TurboCore模式,但会拥有最多的核心与线程,非常适用于高度并行应用与高性能计算(注:该功能目前仅在Power 780服务器上可用)
智能线程(Intelligent Thread):可根据工作流的负载情况在1/2/4个线程之间智能切换,以保证最佳的运行效率
智能缓存(Intelligent Cache):智能的Fluid(流动)的混合L3缓存结构可以让核心充分利用缓存空间,并对核与核之间的访问进行优化
智能能耗优化(Intelligent Energy Optimization):在散热条件允许的情况下最大限度的提升性能,或者在工作效率允许的前提下,尽量降低处理器的能耗
主动内存扩展(Active Memory Expansion):在应用有需求的时候(比如SAP的ERP应用),通过内存压缩技术将现有的内存数据进行压缩,以腾出物理内存空间,最多可等效扩充50%的内存容量,用户也因此可以在部署相关应用时节省50%内存容量的成本(注:该功能仅在AIX 6.1操作系统下可用)
固态盘(Solid State Drives):POWER7系统全面支持固态盘,以优化I/O访问速度,为那些对I/O访问敏感的应用进一步加速
Power到底意味着什么呢?……
最后,通过POWER7,我们还可以总结一下Power系统的优势。IBM认为,它是针对工作负载而优化的系统、可无限制的部署虚拟化、具备无宕机的弹性扩展能力、具备动态的能源优化能力、具备自动化的管理能力,从而提供卓越的整合价值,这一切也将在POWER7系统上进一步得到体现。
说到这里,POWER7要肩负的使命又是什么呢?上文已经讲过,小型机的一大优势就是高可扩展性,目前最高32插槽的可扩展性,x86服务器还是望尘莫及的。POWER7当然也不例外,它同样具备32插槽的高扩展能力,再配合处理器本身的强大运算能力,基本可以等同于128插槽的POWER6系统,这种计算能力已经是很可怕了。
32插槽的POWER7系统架构
IBM Power系统之所以强大,除了硬件方面的优势外,强大的软件与生态环境也是重要的原因,并且在这些领域IBM有着强大的话语权
不过正所谓合久必分,分久必合。当电脑从大型机不断的分化至PC之后,现在又逐步的,有针对性将部分应用向集中模式转移,因此传统的大型计算设备似乎又找到了自己的栖身之地,这就是云计算。应用与数据的高度集中,也必然对云计算中心的计算能力和数据吞吐量提出了严峻的需求,而具有高度集中整合,以及高度可扩展能力的小型机,在云计算领域也完全有着自己的优势。而POWER7系统的出现,也增加了IBM在这一领域的竞争筹码。
以32插槽的终极系统来看,POWER7系统的总体吞吐量是POWER6系统的5倍,而全局的一致性带宽吞吐量则从320GB/s提升至450GB/s
POWER7系统的终极目标——超级可扩展的云计算平台
x86服务器的高性能化推动了虚拟化与IT整合时代的到来,而小型机则将向更高端的云计算中心迈进,与此同时,在虚拟化帮助下,小型机也可以更好的整合x86服务器上的应用,所以虚拟化对于x86和小型机均是一个推动力。如今,高性能的POWER7的发布也将意味着超级可扩展云计算平台的诞生,我想这就是IBM所赋予POWER7的终极目标,也是在传统小型机优势行业之外的另一块引人瞩目的新市场。的确,小型机太需要新的市场来拉动了。
POWER7服务器产品展示与价格信息2月8日,IBM在发布POWER7处理器的同时,也面向主要的应用领域推出了四款新的POWER7服务器,下面我们就具体来看一下。
POWER7服务器产品家族,其中Power 750与755均获得了能源之星的认证,成为了第一个具备该资格的RISC小型机系统,不过这张图中有些错误,Power 750的最高核心量与主频应该是32 x3.55GHz,Power 770的最高核心数量应该为64 x 3.5GHz
当前最低端的POWER7服务器——Power 750服务器
面向高性能计算(HPC)领域的Power 755服务器,从外观上看,可以看出与Power 750完全一样,因此你可以把755看做是HPC定制化的Power 750
IBM Power 770服务器
IBM Power 780服务器,是目前已经发布的POWER7服务器中的最顶级型号
IBM POWER7服务器家族具体规格一览(点击放大),图中的标注:1、Power 780的处理器卡(对应一个节点)拥有16个POWER7核心,如果运行的可选的 TurboCore模式下,主频将达到4.1GHz,但可用核心数量减半;2、用于Power 750以及755上的8 GB (2 x 4 GB)内存特性计划于2010年3月16日可用;3、Power 770与Power 780的128 GB (4 x 32 GB)内存特性计划于2010年11月19日可用;4、Power 770与Power 780的内存在800MHz时,最大容量为2TB,在1066MHz时为1TB;5、IBM声明在Power 750服务器上最大的微分区数量为320个,在Power 770和780服务器上则为640个;6、Red Hat公司支持POWER7处理器,Red Hat的目标是在2010年上半年推出支持 Power 750, 755, 770与780的Linux操作系统,至于具体的可用信息,请咨询Red Hat公司
从规格表中,我们能发现POWER7处理器分为8核心与6核心两种设计,因此会出现8插槽48核心的情况,这也是IBM根据市场的需求做出的安排,但IBM并没有提供详细的POWER7的编号列表,所以我们也不太清楚8核心与6核心的型号与主频关系。根据POWER7服务器的规格表,我们大概总结如下:6核心的POWER7主频:3.3/3.5GHz;8核心的POWER7主频:3.0/3.3/3.55/3.8,而如果采用TurboCore模式时,8核心的3.8GHz POWER7将升级为4核心的4.14GHz的POWER7。另外,POWER7的L3缓存容量也将随核心数量的变化更改变,即以每个核心4MB的容量为标准,6核心时就是24MB,4核心时就是16MB了。
POWER7服务器的RAS特性,图中标注:1、Live Partition Mobility/Live Application Mobility 不支持IBM i 6.1操作系统;2、
Active Memory Sharing需要 AIX 6.1 TL3、IBM i 6.1或SUSE Linux Enterprise Server 11 for Power及更新版本操作系统每张;3、需要两个或以上的节点;4、Hot-Node Add, Hot-Node Repair与Memory Upgrade功能计划在2010年11月19日开始可用
需要指出的是,POWER7的服务器远不止这些,比如刀片服务器,本次并没有发布。IBM预计在4月份会推出POWER7的刀片服务器,涵盖双插槽和4插槽系统,另外还将针对老一代570和595服务器推出POWER7的升级服务器,从570升级到Power 770,这个已经发布了,而595则可升级至POWER 795,但这款产品还没有发布。另外,日本的日立公司也于2月10日发布了三款采用POWER7的服务器,分别是EP8000 780、EP8000 770和EP8000 750,不过从设计上来看,应该是IBM Power 780/770/750的OEM版。
此外,在对老的POWER6应用的支持方面,POWER7服务器也有两手准备,当采用的是AIX 5.3操作系统时,POWER7处理器将只有两个核心可用,以确保兼容POWER6的应用,而如果安装的是AIX 6.1或更高版本的操作系统,则完全可以利用到POWER7的所有功能来跑POWER6的应用。具体的升级以及对老产品应用的兼容性信息,有兴趣者可进一步咨询IBM的经销商。
看完服务器的介绍,肯定很多人都在关心POWER7服务器的价格,我们在这里做了一个简要的对比,由于都是来自于网上的报价,所以谨供参考,如若需要进一步信息,请与相关厂商进行接洽。
从价格水平来看,POWER7不光规格高端,在价格上也完全继承了小型机的高端传统,顶级的x86服务器与之相比可谓小巫见大巫,即使是现有的小型机友商的产品也明显跟不上“档次”,那么POWER7服务器的性能到底对得起对不起这样的价格呢?接着往下看……
POWER7服务器性能展示(总览)伴随着POWER7的发布,POWER7服务器的性能到底如何?也成为了业界所关注的焦点,而相对于x86开放平台的“同质化”,小型机的“封闭性”也让人们对它的性能非常好奇。我们根据IBM公布的资料先在市场中进行同级的比较。
采用两台这次新发布的最低端Power 750服务器,在核心数量上达到了64个,ERP性能等效于两台HP DL785 G6(一台48核心,共96核心)及9台HP DL380 G6(一台8核心,共72核心),相比之下,750节省了75%的占用空间,90%的网络连接以及72%的系统管理数量
IBM认为一台Power 780服务器可以整合8台HP的动能服务器,CPU利用率可达80%,并可节省87%的软件授权费用(以核心为授权单位),而占地面积也只有不到8台动能服务器的10%,总体成本也将节约92%
在具备高性能的同时,Power 750的能耗表现获得了能源之星的认可,每瓦性能优势突出
在与现有的多插槽服务器相对比时,可见即使是最低端的4插槽Power 750仍然具有明显的性能优势,而750只是POWER7服务器里的低端产品
Power 750的整数运算性能与现有的其他4插槽服务器对比,大约是HP DL585的2.5倍
最后,在与同家POWER系统相比时,根据rPerf性能与功耗的对比值(即性能/功耗比)来看,POWER7系统(Power 780)是Power6+系统(System p570)的3倍,是Power4系统的30倍
POWER7服务器性能展示(POWER家族—AIX/IBM i系统)
在与友商比较完之后,我们再来看看IBM提供的,POWER7服务器与以往POWER系统的性能对比。以下是AIX或IBM i操作系统下的测试成绩,由IBM测试得出。
IBM i操作系统CPW(Commercial Processing Workload)性能测试,8插槽的Power 780的性能大约是32插槽System P595的1.2倍,从性价比上讲,这已经是一个惊人的数字,如果同以8插槽计算,POWER7 3.8GHz的CPW性能大概是Power6 5.0GHz的5倍
AIX系统下, SAP的SD2-Tier测试成绩,4插槽的Power 750(3.55GHz)的性能已经超过了32插槽的System p570(4.2GHz)
AIX系统下的rPerf参考性能对比,以8插槽的系统相对比,Power 780(3.86GHz)的性能约是上一代System p595(5.0GHz)的4.2倍,如果按4.14GHz的最高POWER7性能计算,4插槽的Power 780的性能已经与24插槽的p595(5.0GHz)相当了
AIX系统下,高性能计算STREAM Benchmarks测试成绩,4插槽的Power 755(3.3GHz)的性能已经接近于16插槽的System p575(4.7GHz)
AIX系统下,高性能计算SPEC OMP2001性能测试,4插槽的Power 755(3.3GHz)已经超过了32插槽Power5核心的System p595(1.9GHz),等效比约为4.6倍
单系统下,AIX环境Linpack测试成绩,4插槽的Power 750(3.55GHz)的性能已经快与32插槽的System p595(5.0GHz)有一拼了
AIX系统下Java性能测试,4插槽的Power 750(3.55GHz)性能已经明显超过了16插槽的System p570(4.2GHz)
AIX系统下多用户rPerf性能测试,4插槽4.14GHz的Power 780系统性能基本上是4插槽p595(5.0GHz)的2.6倍,而8插槽的Power 780(3.86GHz)的性能已经明显超过了32插槽的p595(5.0GHz)
由此我们可以看出POWER7服务器相对于POWER6服务器的性能提升,与处理器本身的性能提升幅度相差不多,大多数的测试成绩均保持在4倍左右的领先幅度,最低的也有2.6倍,最高甚至达到了5倍左右。
POWER7服务器性能展示(POWER家族—AIX/IBM i系统)在与友商比较完之后,我们再来看看IBM提供的,POWER7服务器与以往POWER系统的性能对比。以下是AIX或IBM i操作系统下的测试成绩,由IBM测试得出。
IBM i操作系统CPW(Commercial Processing Workload)性能测试,8插槽的Power 780的性能大约是32插槽System P595的1.2倍,从性价比上讲,这已经是一个惊人的数字,如果同以8插槽计算,POWER7 3.8GHz的CPW性能大概是Power6 5.0GHz的5倍
AIX系统下, SAP的SD2-Tier测试成绩,4插槽的Power 750(3.55GHz)的性能已经超过了16插槽的System p570(4.2GHz)
AIX系统下的rPerf参考性能对比,以8插槽的系统相对比,Power 780(3.86GHz)的性能约是上一代System p595(5.0GHz)的4.2倍,如果按4.14GHz的最高POWER7性能计算,4插槽的Power 780的性能已经与24插槽的p595(5.0GHz)相当了
AIX系统下,高性能计算STREAM Benchmarks测试成绩,4插槽的Power 755(3.3GHz)的性能已经接近于16插槽的System p575(4.7GHz)
AIX系统下,高性能计算SPEC OMP2001性能测试,4插槽的Power 755(3.3GHz)已经超过了32插槽Power5核心的System p595(1.9GHz),等效比约为4.6倍
单系统下,AIX环境Linpack测试成绩,4插槽的Power 750(3.55GHz)的性能已经快与32插槽的System p595(5.0GHz)有一拼了,达到了后者80%的水平,等效之后,单插槽的性能约是p595(5.0GHz)的6.4倍
AIX系统下Java性能测试,4插槽的Power 750(3.55GHz)性能已经明显超过了16插槽的System p570(4.2GHz)
AIX系统下多用户rPerf性能测试,4插槽4.14GHz的Power 780系统性能基本上是4插槽p595(5.0GHz)的2.6倍,而8插槽的Power 780(3.86GHz)的性能已经明显超过了32插槽的p595(5.0GHz)
由此我们可以看出POWER7服务器相对于POWER6服务器的性能提升,与处理器本身的性能提升幅度相差不多,大多数的测试成绩均保持在4倍左右的领先幅度,最低的也有2.6倍,最高甚至达到了6倍左右。
POWER7服务器性能展示(POWER家族—Linux系统)对比完AIX与IBM i操作系统之后,再来看看Linux系统下的性能表现,而对Linux系统的支持,无疑大大扩展了POWER小型机的应用领地。
Linux环境下,多用户SPEC CPU2006性能测试,4插槽的Power 750(3.55GHz)的整数运算性能已经超过了16插槽的System p575(4.7GHz)
Linux环境下,高性能计算(HPC)STREAM Benchmark性能测试,4插槽Power 755(3.3GHz)与16插槽的System p575(4.7GHz)比较接近了
Linux环境下SPEC OMP2001性能测试,同时4插槽的情况下,POWER7 3.55GHz的系统性能是Power 6 4.2GHz系统的2.5倍
Linux环境下的Java性能测试,4插槽的Power 750(3.55GHz)的性能已经超过了16插槽的Power6+系统p570(4.2GHz)
在Linux系统下,POWER7服务器的性能表现与在AIX/IBM i系统下的表现相当,相对于POWER6系统,基本也保持了4倍左右的领先幅度,因此我们可以说POWER7的8个核心相对于以往的2核心的确体现出了就有的性能。现在再回头看看服务器的价格,你又会有何想法呢?
不管什么怎么说,我认为POWER7处理器的诞生为小型机开启了新纪元,也必将为小型机的发展注入新的活力,据IBM中国的相关人员透露,中国的Power用户中已经有几家率先部署了POWER7服务器,这显然是个小兆头,下面就看IBM如何充分的发挥好它的实力了。而另一方面,其与新一代高端x86和第三代安腾处理器的好戏也才刚刚上演,我们也将继续关注新一轮的竞争与博弈……