科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航



ZDNet>服务器频道>X86-zhiding>AMD平台加盟 惠普ProLiant Gen8再添新兵

AMD平台加盟 惠普ProLiant Gen8再添新兵

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

2012年3月16日,惠普在北京正式发布了其耗资3亿美元、耗时两年的Voyager计划的研究成果——ProLiant Gen8服务器,它以涵盖整个惠普融合基础设施的全新系统架构——HP ProActive Insight为核心,引发了x86服务器在核心性能架构以外的自主式生命周期管理的创新。而在3个月之后,它又迎来了新的成员——采用AMD皓龙6200(Opteron 6200)系列处理器的Gen8服务器,从而使其产品线更为完整,为用户又提供了一个新的且强有力的选择。

赵效民 来源:ZDNet 【原创】 2012年07月16日

关键字:AMD Gen8 皓龙

2012年3月16日,惠普在北京正式发布了其耗资3亿美元、耗时两年的Voyager计划的研究成果——ProLiant Gen8服务器,它以涵盖整个惠普融合基础设施的全新系统架构——HP ProActive Insight为核心,引发了x86服务器在核心性能架构以外的自主式生命周期管理的创新。而在3个月之后,它又迎来了新的成员——采用AMD皓龙6200(Opteron 6200)系列处理器的Gen8服务器,从而使其产品线更为完整,为用户又提供了一个新的且强有力的选择。

Opteron 6200处理器新特性简介

在深入了解AMD平台Gen 8服务器之前,我想有必要对于Opteron 6200处理器进行一个必要的介绍,毕竟这是其相对于英特尔平台Gen8服务器最大的不同。Opteron 6200处理的一大亮点在于其采用了崭新设计的“推土机”(Bulldozer)核心架构,有关Bulldozer处理器架构的介绍,已经有很多了,但为了文章的完整性,我们今天也在此做一简单的回顾与介绍,首先要明确的是,从Bulldozer开始,传统意义上的“CPU核心”的概念已经有了变化。

Bulldozer的“模块”架构图,可以看作是两个整数处理核心共享一个浮点处理单元的设计 ,因为日常的处理运算中,更多的是整数处理,所以这就变向的等于在一个模块可以同时处理两个整数处理线程,而无需共享处理管线

AMD当初开发Bulldozer架构的初衷在于,经调查发现日常的IT应用主要集中于整数运算,而浮点运算相对较少。为了提高多线程处理的性能,AMD 设想可不可以用2+1的方式来解决,即两个整数处理核心+1个浮点处理单元,以组成一个新架构的处理单元——Module(模块)。 众所周知,在多线程处理方面,英特尔最早提出了Hyper-Threading(超线程)的理念,可以使操作系统或者应用软件的多个线程,同时运行于一个 超线程处理器上,其内部的两个逻辑处理器共享一组处理器执行单元。而AMD CPU的两个线程使用各自的单元,但两个线程是共享命令解码器和浮点运算等资源的。因为是整数运算,所有线程之间没有冲突,因此吞吐量有所提高。

从芯片级别看Bulldozer模块,每个模块拥有自己的L2缓存,L3缓存则为晶片级共享

Opteron 6200与4200的晶片设计图,4200由单晶片(功能单元略有不同)构成,最多4个模块(8核心),6200由两块该晶片组成,最多8个模块(16个核心)

由于这种2+1的核心设计,在Bulldozer的架构中,其核心(Core)的概念已经与传统认识有了较大的不同,单一的核心并不是一个具备完整功能的处理单位,所以AMD一直在用Bulldozer Module来表示Bulldozer处理器的处理单元,所以在后文的介绍中,对于Opteron 6200我们也将用模块和核心两个概念表述——在这里,核心是指组成模块中的整数处理单元,它们共享一个弹性浮点处理单元(Flex FP)。

Opteron 6200的内部架构图,相当于用两块4200组成,两个芯片之间由HyperTransport总线互联

在Bulldozer架构中,非常值得一提的是由两个整数处理核心共享的Flex FP处理单元与新增加的独家指令集。这一Flex FP由两个128bit FMAC(Fused Multiply–Add Capability,混合乘加)处理单元组成,之所以称为弹性(Flex),是因为这两个单元可以各自独立,为每个整数核心提供独享的128bit浮点 处理单元(此时可以认为是两个具备有整数运算+128bit浮点运算单元的处理核心,组成了Bulldozer Module),也可以组合成一个256bit的浮点处理单元为一个模块提供服务,这其实给编程人员提供了很好的弹性,但也预示着对现有的应用需要进一步的优化。

Opteron 6200与6100、英特尔的SandyBridge之间的浮点处理模式的对比

简单来说,这种两个128bit单元弹性组合的方式,提供了有多种指令处理的模式,比如对于同时执行两个128bit的AVX指令,SandyBridge单一的256bit FP单元就不行了,而Flex FP则可以,同样的,这也适用于SSE指令。所以,AMD强调,除非是256bit的AVX指令环境,否则6200的单周期浮点处理能力是SandyBridge的两倍,显然灵活的可分拆也可组合的Flex FP功不可没。

Opteron 6200除了具备与英特尔SandyBridge相同的指令集外,还独家提供了两套指令集

目前主流的编译器大多已经支持AMD的FMA4和XOP指令集

而为了发挥Flex FP的强大的威力,AMD也专门开发了两套针对浮点运算的指令集FMA4与XOP,两者可以说都是为高性能计算所服务,但侧重点不太相同,FMA4更有针 对性,比如向量和矩阵计算、多项式评估、数据信号处理等,而XOP则针对数学、多媒体应用等。目前,主流的编译器大多已经全部或部分支持AMD的新指令 集,因此在发挥Bulldozer的浮点威力方面,还是很让人期待的。

新一代Opteron 6200/4200的主要特性

说完主要的处理架构的亮点外,我们再来看看其他方面的改。AMD强调了新一代处理器在三个方面的灵活性优势,分别是处理性能的灵活性,能耗的灵活性与平台及虚拟化的灵活性。而相较上一代的6100处理器平台,我认为前两者的改进最为明显。

Opteron 6200与6100对比,请注意整数处理的每周期发射数的提高(预示整数性能提升更明显)、Turbo CORE超频、C6能耗控制等新的变化

每个核心都有6个能耗/性能等级(P-States),可以根据TDP的设定而将最高性能限制在某一等级之下,而当与TurboCORE技术相配合时,我们能发现又多出两个等级,以提供最强的核心性能。在Opteron 6200平台上,用户可以在BIOS中通过AMD新推出的TDP Power Cap功能设定总功耗限制,而P-States也就会做出相应的限定,目前可达到的调节精度为1W,以保证尽可能的利用好最大的可允许功率

新增加的C6能耗控制状态,在这一状态,空闲的模块可以单独进入C6状态,此时模块停止供电与时钟信号,从而可最多节省95%的能耗。在Bulldozer处理器,每个模块的状态将保存在内存中

AMD TurboCORE技术实现了类似于英特尔“睿频”(TurboBoost)的功能

我们已经对英特尔的“睿频”技术有所了解,它可以在处理器的能耗不超出TDP功率限制的前提下,根据应用的性能需求,提升处理器核心的运行频率以最大限度挖掘核心的处理性能,而在Opteron 6200上也同样具备了这一能力,它就是AMD 的TurboCORE技术,它可分为两个模式。一种是All Core模式,所有的模块都可以提升300至500MHz的主频,另一种是Max Turbo,即如果一些轻负载线程让一半的模块可以将进入C6状态,但余下的模块又需要最大的处理性能,此时可以在All Core的基础上再增加500MHz(即最高可超频1GHz)。

AMD中国区服务器产品经理梁宏伟表示,新一代Opteron 6200处理器更为突出能耗性能比的优势,为用户带来更有价值的应用体验,而这种价值是很多用户长久忽视的。AMD大中华区服务器销售总监赵永琳也表示, 现在很多时候处理器的性能都处于过量供给的状态,所以越来越多的人开始关注低功耗、高效率的解决方案,他们已经不再强调处理器的绝对性能,而更看重处理平 台所带来的价值,AMD平台以更低的成本、更低的能耗提供完全能满足用户需求的性能,将会带给用户多的价值,而这也是越来越多大型企业选择AMD平台的原 因。他强调,在中国有超过200万颗皓龙处理器是在这些大的公有云或者私有云上面运行。在未来,AMD将会为提供一个最好的性能、价格、功耗比的产品而继 续努力。

基于Opteron 6200的ProLiant Gen8

前文说过ProLiant Gen8服务器的一个主要创新就是HP ProActive Insight架构,涉及资产管理、健康监测与性能加速等主要领域。而AMD平台的Gen8服务器,则将HP ProActive Insight架构完全保留,在此基础上融入了AMD Opteron平台的创新。

惠普ProLiant Gen8服务器的主要创新设计

ProActive Insight架构所涵盖的三大方向,可帮助用户获得更好的生命周期管理、数据保护、应用加速与资产管理的体验

中国惠普企业集团工业标准服务器产品部产品经理安源表示,HP ProLiant Gen8服务器已在100多个真实数据中心通过测试,并在开发过程中采用了超过150项受客户启发的设计创新。这些创新大大加速了应用性能,也使管理员能够通过解决可导致故障、宕机及数据丢失的常见问题,将服务器的可用性最大化。总体来说,ProLiant Gen8服务器在架构设计上的综合优势主要有4点:

1、整体生命周期自动化——通过对手动任务进行自动化,加速应用部署并主动提高正常运行时间。因此,客户可提高生产力、减少错误并能大幅简化操作。凭借这些改进,HP ProLiant Gen8服务器可使一个典型的约1000平方米数据中心的IT员工平均每人每年节约30天的管理时间。

2、动态工作负载加速——通过融合服务器和借助于智能惠普固态磁盘存储技术的存储设计,使得数据密集型存储性能提升了近7倍。智能的分析与负载感知信息,使HP ProLiant Gen8服务器能够实时地优化性能与能效。独特的Advanced Data Mirroring与智能算法确保数据的安全性提高1000倍,并将独立磁盘冗余阵列(RAID)初始化的速度提高95%。

3、自动化的能源优化——凭借HP ProLiant Gen8高能效服务器及采用内置传感器的业界首款智能机架,三年之内可在一个典型数据中心内提供近两倍的每瓦计算能力,并节约700万美元的能源成本。 HP3-D海洋传感器能够将资产管理自动化,并精确跟踪每个机架和服务器的电源使用情况,让管理员得以轻松优化工作负载。而竞争对手服务器则迫使企业人工 操作资产、跟踪以及测量电力和制冷管理。这需要大量资源,还将引发由于配置错误造成的宕机风险,并提高能源成本。

4、主动的服务与支持——业界首个最全面的基于云的IT管理和个性化支持门户HP Insight Online,可使客户首次问题的解决率达到95%。HP Insight Online与HP ProLiant Gen8智能技术HP Insight Remote Support和惠普服务相集成,并通过自动收集服务器资产、健康状况、合同、保修和支持案例信息而为客户提供融合服务器管理与支持体验。数据随时随地安全可用,让客户能够通过HP ServiceONE计划联系惠普授权的渠道合作伙伴,除了快速解决问题之外还提供主动问题预防。
 

新一代ProLiant DL385p Gen8服务器概览

这次AMD平台的Gen8服务器,全部面向双路服务器市场,分别是机架服务器DL385p Gen8与刀片服务器BL465c Gen8,由此可以看出惠普对AMD平台Gen8服务器的定位——主攻采购量最大的双路服务器市场。中国惠普企业集团工业标准服务器产品部产品经理陈晖强调,惠普是业界第一个将AMD平台与最新有服务器架构相结合的厂商,在AMD平台市场居于明确的领先地位。

ProLiant DL385p Gen8与其他厂商现有的2U机架式Opteron 6200服务器的对比

BL465c Gen8相较BL465c G7的特性比较,主要更新了板载网络、高性能阵列卡、扩展槽以及新一代的管理组件

BL465c Gen8与BL465c G7的详细对比

结合AMD Opteron 6200平台的特点与Gen8服务器本身的架构优势,惠普对AMD平台Gen8服务器的市场定位

中国惠普企业集团工业标准服务器产品部产品经理陈晖表示,新一代的AMD平台Gen8服务器将与同样采用Opteron 6200处理器的G7服务器在市场上共存,具体来说,同型号前缀的G7产品将会停产(DL385 G7与BL465c G7),留有两个月的市场交接期,但其他的产品,如DL165 G7、DL585 G7、BL685c G7将会继续生产,因为它们并没有同级的Gen 8替换型号。而面对这一样一个交叉的产品重叠,陈晖认为并不会对用户的选择造成什么困扰,原来用AMD Opteron 6100平台的,现在可以直接升级至Opteron 6200平台的Gen8服务器,而如果已经升级到Opteron 6200平台的G7服务器,则要看在管理方面有没有更严格的需求,否则是没有必要升级至Gen8。

当被问及在4路市场上没有做升级,是否表明了惠普对AMD平台4路服务器的战略有变时,陈晖否认了这一说法。“AMD平台的4路服务器一直保持着良好的出货量,这对于惠普的ProLiant产品线非常重要,而这次并没有推出DL585 Gen8和BL685c Gen8并不代表策略有变,在下一次AMD平台更新时,我相信大家会看到新一代的AMD平台四路服务器。”

此外,他还表示,“由于这次E5-2600系列因在内存DIMM数量上的提高,所以使得其在平台成本上已经与AMD平台持平(原来的至强5600平台每CPU只带9个DIMM,而AMD Opteron 6200则是12个,E5-2600平台也提升至每CPU 12个DIMM),因此AMD平台已经不再吃亏。”

“总之,在性价比方面,我是有信心AMD平台ProLiant Gen8仍然领先于对手,这也是很多用户所忽略的!”他最后强调。

综合评分:8.07 分
云能力:7.1 分
营业额:54.2亿美元[2012]
云服务:AMD虚拟化

查看更多 >>

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅ZDNet技术邮件将是您的最佳途径之一。