ZD至顶网服务器频道 08月26日 新闻消息(文/董培欣):谈到企业级服务器市场,人们首先想到的会是x86 E5、E7系列的CPU产品,IBM在企业级市场推出的Power Systems服务器产品很少会被用户了解。可是在今年春天举行的OpenPOWER峰会上,谷歌明确表达了关于打造基于OpenPower的可扩展服务器解决方案的计划。将Power处理器又一次展示在用户面前,Power与x86相比有什么技术特点引起了google的青睐?下面让我们从指标和应用两个方面去好好分析一下。
2014年,曾有两个不同的第三方机构分别将IBM Power8与Intel Xeon E5-2697 v2和Intel Xeon E7-8890 v4做了一次硬件指标对比。两年过去了,现在随着Intel Tick-Tock(工艺年-构架年)的芯片发展模式,现在Intel Xeon处理器型号已经发展到Xeon v4。因此我将目前可以查到的最新Xeon v4相关处理器硬件指标也同时列出,再综合进行一下对比。
Power8 VS Xeon E5
|
POWER8 |
Intel Xeon E5-2697 v2 |
Intel Xeon E5-2697 v4 |
处理器速度 |
4.15GHz |
2.697GHz |
2.3GHz |
内核(单一插槽) |
12 |
12 |
18 |
每核线程数 |
8 |
2 |
2 |
最大主存储器容量 |
1TB |
768GB |
|
内存控制器 |
2 |
1 |
1 |
片上缓存 |
|
|
|
L1 |
64KB/核 |
32KB I + 32KB D/核 |
|
L2 |
512KB/核 |
256KB/核 |
|
L3 |
96MB/芯片 |
30MB/芯片 |
45 MB/芯片 |
内存带宽 |
230GB/s |
59.7GB/s |
|
输入/输出 |
PCIe Gen3 |
PCIe Gen3 |
|
设备加速器 |
CAPI |
QPI |
QPI |
Power8 VS Xeon E7
|
POWER8 |
Intel Xeon E7-8890 v2 |
Intel Xeon E7-8890 v4 |
每个CPU内核数 |
12 |
15 |
24 |
每个CPU的线程数 |
8(96) |
2(30) |
2(48) |
最大可寻址内存(每插槽) |
2TB(S824) 16TB(E880) |
1.5TB |
12TB |
最大处理器速度 |
5GHz |
3.4GHz |
2.6GHz |
片上缓存 |
64KB/核 |
|
|
L2 |
6MB |
3.5MB |
|
L3 |
96MB |
37.5MB |
60MB |
CPU核心规模(Die) |
22nm |
22nm |
14nm |
功耗 |
250W |
155W |
165W |
内存带宽 |
230GB/s |
85GB/s |
|
IBM的Power 9处理器预计要到明年下半年才能正式推出,届时Intel应该会有更新的Xeon处理器进行应对。因此这里将Power8与Intel Xeon v2、v4处理器的硬件指标同表进行对比。
在这里让我们来重点对比一下CPU主频、内核数和CPU线程。
在主频方面Power8 CPU占据着优势。最大5GHz的主频比表中Intel主频最高的Xeon E7-8890 v2还要高出不少。Xeon E7-8890 v4虽然在工艺和构架上都有改善,但CPU主频却有大幅下降,仅为2.6GHz。
在CPU内核数量方面,Intel这两年有长足发展,当时与Power8同样有12个内核的Xeon E5-2697 v2现在已经升级到18个内核的Xeon E5-2697 v4(但是CPU主频下降到2.3GHz),以前15个内核的Xeon E7-8890 v2更是升级到了具备24个内核的Intel Xeon E7-8890 v4。光从CPU内核数量看来,只有明年当Power 9面世后,才能在这方面与当前的Intel进行比拼。
不过要是按CPU线程数来计算的话,这个结果马上就被翻转过来,Power8处理器每个内核可以支持8个处理线程,而Intel Xeon只能支持双线程处理。换句话说,Power8可以在系统中虚拟出多达96个CPU而Intel Xeon即便是8890 v4最多也只能虚拟出48个,只达到Power8的一半。
CPU的处理能力,不能简单的通过这些硬件指标进行评估。接下来,让我们再通过Power与Intel所采用的不同指令集再进一步做一下分析。
为了避免过多冗长的技术陈述,我想借用很早以前的一个大轮车与小轮车的广告来对此进行说明。RISC就像是一辆小轮车,车轮转一圈移动的距离短(指令长度短,每个时钟周期内处理的任务数量少),CISC就像是一辆大轮车,车轮转一圈移动的距离长(指令长度长,每个时钟周期内可以处理更多更复杂的任务)。小轮车的速度要想和大轮车一样,就要转的更快(有更高的主频)。所以在同一个时钟周期内,CISC可以进行更多的工作,RISC由于做的工作少,因此可以实现更高的主频,甚至分出更多的工作线程。
从应用的角度来看,CISC更适合桌面端应用的处理。无论是图形、图像、视频文档,都需要进行复杂的运算,CISC更长的指令长度可以在更少的时钟周期内处理更多的工作,从而降低主频,减少主机功耗。
而服务器端的应用刚好相反,服务器处理的绝大部分应用就是寻址和转发。但是需要应对海量用户,进高强度的重复工作。这时候具备更高主频、更多工作线程的RISC指令集优势可以充分显示出来。
上面指标性的对比还是有些空泛,下面从Web访问、虚拟机、数据库的实际应用角度去做一下具体分析。
我曾经长年进行网络及网络安全产品的应用性能测试,在服务器的Web应用性能测试上也有一些涉猎。下面就将以往对服务器Web应用性能测试的体验给大家介绍一下:
在以前对服务器网络应用性能进行测试时,有这样一个发现,服务器在对Web应用请求进行处理的时候,无论采用静态页面还是动态页面进行应用请求测试,在相同请求速率下,服务器CPU负载压力的变化并不明显。
实际分析一下可以了解,无论静态页面、动态页面甚至目前新出现的HTML5,服务器端所做的工作都只是将页面请求的内容或数据传输到客户端。更多的后期运算、处理工作均是在客户端来进行的。反倒是更多的每秒应用连接请求响应,会给服务器CPU带来更多的处理压力。(当然网络带宽和并发连接也是非常重要的考核指标,但与CPU运算相关度不高,这里就先忽略一下了。)此类简单而高度重复性的工作,从理论上讲,更加适合于主频更高,指令更精简的Power系列处理器进行处理。
但这也只是一个从理论上的推断,由于以前接触基于Power处理器的服务器机会较少,因此目前无法拿出更直观的性能对比数据进行比较。希望今后能有机会再与IBM合作,对其Power服务器应用性能进行更深一步的研究。
x86的虚拟机搭建人们已经讲了许多,但虚拟机的资源占用情况却总被有意无意的忽略掉。目前无论采用KVM还是VMware的方式进行云计算系统搭建,在对众多虚机的系统资源进行管理时,大约会占用20%左右的x86 CPU处理资源。此外,每个虚拟机至少需要一个虚拟网卡对网络应用进行处理,这些虚拟网卡的数据转发也需要消耗大量CPU处理资源。还有一些虚拟系统内部的VLAN、VXLAN之类的网段划分……这些虚拟化系统的资源占用,保守估计将占用服务器CPU处理资源的50%以上。如果采用的是一些开源虚拟化系统,CPU资源占用可能因为未进行过专门系统优化而进一步增加。
这些问题在一两个虚拟化节点中还不明显,但随着虚拟化规模的扩大,虚拟系统资源占用的问题会逐步的显现出来。下面一张图片,也许可以形象的表达出,在基于x86的开源云计算系统中,实际应用处理的工作方式。
IBM POWER进行虚拟系统搭建时则完全不同,采用POWER8处理器进行虚拟化系统搭建时,可以利用 Power Systems 提供的 IBM PowerVM虚拟化技术。通过虚拟化处理器、内存和 I/O 资源,并对每个内核进行分区,PowerVM 可将工作负载合并到少量主机上。这样,有助于节省硬件和能源成本,同时构建更加灵活的 IT 基础设施。
可能正是基于这些原因,谷歌目前也已经将相当一部分知名Web服务移植到Power系统当中。
大型数据库应用处理原本就是IBM Power的强项,只不过以前这些工作大部分是由小型机或大型机来进行承担。现在采用Power8处理器芯片的IBM Power Systems服务器的出现大幅降低了用户采用大数据技术对企业信息进行深度分析的使用门槛。Power Systems 基于 POWER8 技术的独特创新设计为IBM DB2数据库提供强大平台。DB2下一代内存计算技术结合 BLU Acceleration,可充分利用Power Systems在硬件优势。在并联条件下,更加快速地支持每内核多线程的多核之间发生的更多并发查询。Power Systems提高了内存带宽,数据运算可用内存高达1 TB,加大了每个处理器的缓存,提高了I/O 提取、移动和访问数据的速度。这些能力可通过一致性加速处理接口 (CAPI) 智能加速技术进一步增强。
IBM的客户指出,采用BLU Acceleration 解决方案,DB2压缩率是未压缩表单的10倍,由于只需要处理相关列,内存列处理减少了需要处理的数据。数据忽略可进一步减少需要处理的数据量。数据处理工作可分布到多个POWER8 处理器内核,每个处理器在每条指令处理周期中处理多个数据元。采用 DB2 on Power Systems 的客户,分析工作负载的速度提高了50倍。
记得电影《大唐玄奘》里有这么一段场景,石槃陀虽然带玄奘走了不少捷径,但还是因为心中恐惧,未能与玄奘大师一同前往西域,到是一匹识途的老马带着玄奘大师避过流沙、找到清泉,协助玄奘一同走到了西域。
在通往云计算的路途上也是如此,有些厂商会为用户提供一些捷径,但终因自身技术实力积累的不足,会半途而废。这时,就需要一匹识途的老马带着用户走出困境,走向成功。IBM Power的处理器更新速度虽然比不上Intel但是几年后应用性能依然可以满足用户需求。就像是一匹后劲十足的老马。IBM长年在数据库、中间件方面的技术耕耘,又为这匹老马提供了丰富经验,足以协助用户闯过重重磨难,最终成功完成云计算的技术转型工作。相信,IBM这个蓝色巨人也会借助Power的力量打破桎梏,协助正在向云计算转型的用户,突破困竞,重新步入辉煌。
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。