科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道服务器组件AMD的ARM之路前景几何?

AMD的ARM之路前景几何?

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

AMD将于2014年推出基于ARM架构的Opteron(皓龙)处理器,应该是最近一段时间在IT产业影响最重大的事件之一。由于AMD此前并没有明显的征兆要推出ARM处理器(只是在6月份,AMD曾表示会在明年的APU中引入基于ARM Cortex-A5架构的TrustZone硬件安全技术),所以AMD的这一表态,无疑为近期甚嚣尘上的ARM与x86之争再加一把火。今天,我想在此梳理一下AMD的构想,并以此为引子,就ARM与x86面向数据中心领域的攻守战进行粗浅的分析。

作者:赵效民 来源:ZDNetserver频道【原创】 2012年11月6日

关键字: AMD ARM X86服务器

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共4页)

展望:AMD的ARM之路前景几何?

AMD 进入ARM大家庭,在2014年推出基于Cortex-A50架构的皓龙处理器,所将面对的竞争仍然复杂,所以现在判断它的前景并不清晰。就我个人观点, 这一条路肯定走得不轻松,甚至还会相当艰苦。Cortex-A50解决了AMD在架构设计方面捉襟见肘的问题,但这只是起步,未来它将面对的是更多的对手 与几乎白手起家的生态环境。

先说说对手。在x86市场,AMD只有一个英特尔,但进入ARM领域,虽然也是主打数据中心前端,但ARM里 面向数据中心的玩家不仅仅是AMD,还有不少硬角色,上文谈到的Calxeda就是一个,此外还有AMD的老冤家NVIDIA,所以AMD的对手实际上是 增多了。其实,它原来的对手英特尔也没有闲着,从Pentium4失误随后的Core系列奋起直追,再到Nehalem系列在架构先进性全面反超AMD的 历史,让我们对英特尔这家公司的应变与修正能力有了清醒的认识,它会根据市场的变化迅速调整自己的失误,而不是一味的唯我独尊,这种对手在某种角度上讲是 最可怕的。现在它已经清楚的看到自己在能效比方面的不足,并全力以赴的改良与革新,很难说不会重演Pentium4之后的那一幕。所以,抛开ARM阵营内 部的竞争不谈,我们可以先看看ARM阵营与英特尔未来的对决会是怎样(Web前端x86市场也只有英特尔在玩了)。

Cortex-A50系列的第一批授权厂商——AMD、博通、Calxed、海思(华为)、三星与意法半导体,它们为ARM在处理器平台方面创造了强大的生态系统,但AMD潜在的竞争对手也明显更多了

Cortex-A57与A53核心分别扩展于当前的Cortex-A15与A7核心(两者的一个重要的差别在 于A57是乱序执行,而A53是顺序执行)。根据ARM给出的信息,未来面向数据中心应用的功能设计在Cortex-A57/53上全面具备,比如 64bit指令集(ARMv8)、高级虚拟化支持等等,具体详情在此我们不做详细介绍,有兴趣的读者可以寻找相关的介绍文档。我们在此只是着重于它在服务 器端的架构设想,并推测一下它的性能表现。

在Cortex-A50系列中,A57属于“大核”,A53属于“小核”,分别替代现有的A15与A7,生产工艺将进化至14nm

ARM给出的Cortex-A57与A53的未来应用构想,它们将横跨智能手机、平板电脑与服务器领域,根据big.LITTLE理念,在一颗芯片中,A57与A53核心可以混搭

对于企业级应用,ARM认为A57与 A53均有用武之地。A57可以做到16个核心集成,并可选配GPGPU单元进行加速计算,主攻宏基站、服务器与高性能计算市场,而A53也可以做到16 核心,面向蜂巢基站、数据平面方案、超低功耗Web服务器等市场,但似乎没有给出A57与A53的企业级big.LITTLE的混搭设计方案

对于基于Cortex-A50的ARM处理器设计,值得一提的是ARM所提出的big.LITTLE架构理 念,即将大核(big)与小核(LITTLE)混搭,通过判断负载的轻重来选择所适合的核心,以进一步提高能效比,不过在服务器端A57与A53分工明 确,似乎也没有必要混搭了。在ARM构想中,未来基于A50架构核心的CPU,将可以达到最多16核心的配置,而生产工艺的目标是采用14nm(目前的 A15核心采用的是32/28nm),芯片总功耗估计最高不会超过20W(A57核心,无GPGPU模块)。所以,2014年AMD的ARM-Base的 皓龙芯片的核心数量也应该会达到16个。

那么A57核心的性能将会达到什么水平呢?根据ARM给出的资料,Cortex-A57核心(1.7GHz) 在32位代码的性能方面比Cortex-A15核心(1.5GHz)提高了25%,是Atom N570(1.66GHz)的2.66倍,从这里似乎可以看出它的实力。

ARM给出的Cortex-A57较A15的性能比较,按图中来看A15的性能是N570的两倍

不过不久前有关基于A15架构的三星Exynos 5250处理器的评测,似乎更能反应出它们的差别。Anandtech网站对采用Exynos 5250(1.7GHz双核)的Chrome笔记本进行了测试,并与Atom N570平台进行了比较,通过对比分析,我们似乎能分析出更准确的Cortex-A57核心的性能。

A15架构的三星Exynos 5250处理器与Atom N570的性能对比(来自Anandtech网站)

三星Exynos 5250笔记本与Atom N570笔记本的能耗对比来自Anandtech网站)

抛开图形性能不谈,单看处理性能,5250领先N570的幅度在30-50%左右,而能耗方面则也降低了 30-50%左右,如果按满负载一档计算,5250平台降低25%的能耗,同时获得了31%的性能提升。但是在ARM的资料中,1.5G的A15核心性能 已经是N570的两倍,Exynos 5250的主频是1.7G,但性能领先幅度也没有达到2倍。所以,Cortex-A15核心的真实效能还有待进一步检验。

另一方面,参与比较的Atom N570是2011年第一季度的产品,采用的是45nm工艺(5250是32nm),距今已经一年半多了,而在英特尔的产品阵营中,还有一系列新品,比如 2011年第四季度上市的N2600,采用32nm工艺,虽然主频降低了600MHz,但TDP也下降到了3.8W,比N570低55%。

英特尔的Atom N570与N2600对比

而到今年年底的时候,新一代代号为Centerton的Atom S系列将会上市,较N2600相比,明显是为数据中心设计的。除了仍采用32nm工艺制造外,它采用了两个Saltwell CPU核心,支持超线程,每个核心都有32KB一级指令缓存、24KB一级数据缓存、512KB二级缓存;内存方面支持支持单通道低压 DDR3-1333,最高容量8GB(双DIMM),且支持ECC(N2600不支持);集成4个PCI-E 2.0控制器共八条链路,这是N2600所不具备的,对于服务器设计的好处不言而喻,不过它并没有集成SATA与以太网控制器。此外, Atom S系列支持VT-x虚拟化,这也是N2600没有的能力,明显为数据中心应用所准备。在能耗方面,Atom S系列支持C1/C1E、C6等多种电源管理状态,并支持EIST技术,最大TDP值为8.5W,主频也达到了2.0GHz。

Atom S系列目前已经透露的有3个型号,均为双核心四线程,二级缓存1MB,包括Atom S1220 1.6GHz/8.1W、Atom S1240 1.6GHz/6.1W、Atom S1260 2.0GHz/8.5W。

惠普的“登月计划”中就准备在年底推出采用Centerton的x86版微服务器,与Redstone的设计非常相似。

当然,Cortex-A57处理器将于2014年面世,AMD基于它设计的处理器与Freedom架构的整合产品也将在那一年推出,那么在未来一年里英特尔又将有何动作呢?这就是基于22nm 3D晶体管生产工艺的Atom Avoton处理器。

在2013年是22nm的普及之年,英特尔的Atom Avoton处理器的表现将会奠定其2014年迎战ARM新一代平台的基础

相较Centerton ,Avoton有了全面增强。除了工艺升级外,核心数量也最多升级至8个(配合HT,可达16线程,与16核心的A57处理器有一拼了),每对核心对应 1MB二级缓存,最多4MB。同时,Avoton将会支持乱序执行,虽然有可能是部分支持,但这对于提高性能是非常有帮助的。要知道,Centerton 及以前的Atom都不支持乱序执行,这对于x86指令集来说本身就是吃亏的。而Cortex-A15和57都有乱序执行的功能,现在也终于在Avoton 这一代予以弥补。另外,它还会引入类似Turbo Boost的动态加速技术,预计原始主频最高可达2.4GHz,加速则能达到2.7GHz。内存方面,加入了双通道的支持,内存规格包括 DDR3-1600与DDR3L-1600。在外围集成方面,Avoton将集成以太网、SATA、USB,据称具备4个GbE、4个USB 2.0、两个SATA 6Gbps、4个SATA 3Gbps,以及4个PCI-E 2.0控制器共16条通道。

在能耗方面,Avoton的TDP范围在5-20W,跨度比较大,相信也给用户提供了更多的选择。

英特尔微服务器市场2013年产品路线图

综观英特尔的微服务器领域的产品线,在2013年,除了Avoton之外,还有新一代基于Haswell核心的第三代至强E3处理器(同为22nm 3D晶体管),其中最低配置为双核心/4线程,TDP只有15-20W,与Avoton形成了平滑的对接。

可以看出,在未来的一年里英特尔的布局相当紧密,从架构与制程方面,最大限度利用了英特尔自身的实力(ARM 处理器明年能顺利将28nm制程变成主流就不错了),从指标与配置上来看,到Cortex-A57处理器发布之时,两者可以说已经是旗鼓相当了。而从当前 来看,Atom首先要接触的就是基于Cortex-A9架构的ARM服务器,这其中Calxeda ECX-1000是其中的典型。早前openbenchmarking.org曾做过一次ECX-1000与Atom D525平台的对比测试。虽然D525是2010年上半年的产物,现在已经停产,但还是可以从它们的性能对比中看出一些有用的信息。

openbenchmarking.org公布的Atom D525与Calxeda ECX-1000处理器平台性能测试结果

从测试结果来看,Atom D525较ECX-1000在性能上仍有一定优势,但当ECX-1000达到1.4GHz主频时,则不再明显,而且能耗方面仍然是ECX-1000领先, 但D525(45nm工艺)的TDP达13W,所以若换成Centerton则会有明显的改观。因此,就总体而言,ARM平台在数据中心里并没有表现出绝 对的优胜实力。

而在另一方面,除了性能与能耗之外还有一个重要的因素左右着用户的选择,那就是生态环境,说白了就是买了你 ARM平台有多少数据中心级的应用可以使用?即使是ARM最合适的Web应用领域也不见乐观。国内某著名网站曾经就在CDN设备选型时,对ARM平台和 Atom平台进行了比较,结果与openbenchmarking.org的测试差不多,ARM平台的综合性能功耗比占优,但是如果采用ARM平台的话, 就意味着网站要重新以ARM指令重新编写CDN框架,可网站并没有这方面的人才,最终衡量下来,用户还是选择了Atom平台。

AMD公布的ARM 64bit平台的业界支持者,它们将带动ARM在数据中心领域里的生态环境建设,但不得不说与现有的x86生态系统相比太过薄弱了,不过除了AMD列出的 厂商,开源组织也是一个不可忽视的力量,这方面Apache Tomcat Web服务器已经走在了前面,未来相信越来越多的Apache项目会推出ARM平台版本

我相信,应用环境成熟度与相关人才的配套是ARM想在数据中心普及的一个必须要跨越的鸿沟。在这个领 域,x86相较而言已经非常成熟,无论是平台的多样性,还是软件应用、开发平台与人才储备等方面,都是ARM无法比拟的。因此,当综合性能比较优势并不绝 对明显的时候,用户迁移自己的x86平台至ARM的阻力也就可想而知了。同理,英特尔的手机端x86处理器表现也中规中矩,完全说得过去,但x86在移动 应用开发领域又是什么待遇呢?

从目前来看,以ECX-1000为代表的ARM平台并没有建立起相对Atom的明显优势,而在2013年,单 靠Cortex-A15平台恐怕也很难全面超越Avoton(Avoton也开始支持性能更好的乱序执行,而且是8核设计,外围整合度也更高),甚至被后 者反超也说不准。

所以,综合分析下来,ARM阵营与英特尔的前端对决并不想某些人想象的那么简单。关键的一点就在于大家都在变 化,也都在进步,只不过英特尔在努力做合适减法,将x86架构在Atom平台上尽量的简化,以应对轻负载低能耗之需(甚至为此从乱序执行回归古老的顺序执 行体系),而ARM则在做合适加法,不断的为应对数据中心的需求增加新的功能,比如 64位技术、虚拟化技术以及更多的核心 、密算加速器等等,并也会像x86那样,还要照顾一代代积累的ARM指令集,以做到向上兼容。如今到Cortex-A15这一代,其能耗已经提升了不少, 而Atom的能耗则一代比一代低。在指令集上,x86为了提高自己的效率,降低CISC缺陷所引起的弊病,一直在针对相关应用开发新的指令集(如SSE、 AVX),这一点也在被ARM所采纳(如NEON),所以说大家是在“殊路同归”,在相互借鉴中共同成长,不断进化着自己的技术、架构与最终的产品。因 此,以ARM在手机端的成就预测其在低功耗数据中心前端市场必然成功有点一厢情愿,同理也不能因为x86的强大与Atom的进步就认为x86在移动端的市 场会一帆风顺,它同样要面对应用生态环境的严峻考验。

AMD的加盟肯定会加强ARM在数据中心市场的生态建设,但远不足够,以它的实力还不足以起到英特尔在x86 领域一呼百应的效果。不过,现在有一些好的苗头,比如Windows RT的出现,表明微软愿意在ARM方面上尝试,未来出现Server版RT也说不准,而操作系统是第一步,再往上则是应用开发平台与应用。企业级应用如 ERP、CRM等,先别想在ARM平台上运行,把前端Web市场占住了就不错,现在看来,ARM在数据中心里的应用生态建设将主要取决于开源的方案,然而 它对于用户的开发能力有着不小的挑战,这又涉及到人才的培养,毕竟它与移动端的应用开发完全是两码事……这一圈思考下来,你就能感觉到ARM建立起一个数 据中心生态环境的复杂程度,AMD的ARM征程有多难走也就不言而喻了。

有人会用x86当初战胜RISC企业级处理平台的历史来预测未来的ARM与x86在数据中心里的竞争,认为将 会历史重演——ARM取代x86的地位。不过历史的环境与当前不太一样,虽然x86是以PC起家,再向数据中心扩展,如今ARM是以移动终端起家向后端扩 展,路数相似,但大环境还是有明显的不同。我并不是说ARM战胜x86的可能性为零,不过难度要比当初x86进军数据中心大得多,因为PC应用与数据中心 应用相似度更大,可移动终端与数据中心应用有较大的不同,况且当时还是IT发展的初期,RISC当时在数据中心里也不算有多成熟。但是,现在的数据中心已 经相对成熟得多,各自的生态环境都非常完善,x86想进军移动端有多费劲大家已经很清楚了,ARM进军数据中心端也同样如此。所以历史是否会重演,真的很 难说,我个人认为ARM肯定会在数据中心前端占据一席之地(地盘大小另说),但再往应用与数据库层的进展将会非常缓慢。

而且,除了ARM与x86,还有其他方势力也在关注着数据中心的前端市场,以及ARM可能涉及的领域,如大规模并行密集计算等。这方面的典型代表就是Tilera公司的“众核处理器”架构与解决方案。

Tilera的TILEPro64处理器架构,单芯片64核心

Tilera的方案有点像把Freedom网格架构放在了CPU内部,将众多的轻量级核心互联在一起,再将内 存、I/O等整合在一起,共享给所有核心。在2011年Facebook所做的一次Memcache测试中,TILEPro64的表现不俗,与至强和皓龙 处理器平台相比,能效比也相当出色,在同等功耗下,双路TILEPro64性能基本上是双路至强5600的3倍多。

Facebook所做的Memcache对比测试

因此我们要说窥视数据中心市场的不仅仅是ARM,还有其他的玩家,而且实力也不容小视,虽然它们也缺乏生态系 统的支持,但ARM不也是一样吗?所以除了英特尔之外,AMD面临的潜在对手还有很多。我甚至觉得,AMD应该不仅仅只会在数据中心里采用ARM,它完全 有理由也有实力(尤其是GPU方面)借助ARM杀手移动端市场,不过这都是后话了,让我们走着瞧。

总而言之,AMD选择ARM的理由我们已经可以基本猜到,也能理解——与其在x86领域继续被压制,不如豁出 去闯出一条新路。但是,从另一个角度讲,这条路并不见得比继续开发与Atom同级的x86产品更好走。加盟ARM,AMD在不费多大力气得到一个出色的处 理器架构之外,将面对更多的竞争对手,将会失去x86领域既有的成熟环境,并还要努力开拓新的生态环境。在此,我祝愿AMD的ARM之路能尽量好走些,也 希望数据中心市场能在ARM与x86的对攻中,走向新的境界……

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章