科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道服务器组件AMD的ARM之路前景几何?

AMD的ARM之路前景几何?

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

AMD将于2014年推出基于ARM架构的Opteron(皓龙)处理器,应该是最近一段时间在IT产业影响最重大的事件之一。由于AMD此前并没有明显的征兆要推出ARM处理器(只是在6月份,AMD曾表示会在明年的APU中引入基于ARM Cortex-A5架构的TrustZone硬件安全技术),所以AMD的这一表态,无疑为近期甚嚣尘上的ARM与x86之争再加一把火。今天,我想在此梳理一下AMD的构想,并以此为引子,就ARM与x86面向数据中心领域的攻守战进行粗浅的分析。

作者:赵效民 来源:ZDNetserver频道【原创】 2012年11月6日

关键字: AMD ARM X86服务器

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共4页)

背景:ARM与x86的数据中心之战

有关ARM与x86的争论由来已久,但以往主要是架构上探讨与切磋,更多的属于“纸上谈兵”,可随着双方各自的逐渐发展与成熟,也都具备了越来越大的野心,从而开始扩展领地,擦枪起火乃至正面交锋也就再所难免了。

ARM在将MIPS挤向边缘之后,其处理器的性能提升,结合功耗方面的优势,开始让业界有了将其带入数据中心的想法,而x86在占据数据中心主流地位之后,为了寻求更大的发展也看上了ARM固有的低功耗平台领地。在经过相互试探之后,双方也正式亮剑。

ARM公司在10月30日正式宣布了新一代Cortex-A50架构系列(也是AMD将授权采用的),其新增 的一些特性明显是为数据中心环境所准备的,目前包含两种核心设设计——Cortex-A57与Cortex-A53。而英特尔也不甘试弱,近期也联合众多 OEM伙伴展示基于Atom Z2760处理器平台的Windows 8平板电脑。而就本文所关注的数据中心领域,可以预见,当初x86与传统企业级RISC处理器的一战,必将在ARM与x86之间重演。

ARM与x86之争可以看作是RISC(精简指令集计算,Reduced Instruction-Set Computing)处理器架构与CISC(复杂指令集计算,Complex Instruction Set Computing)处理器架构的又一次重量级对决(上一次在数据中心里,x86战胜了RISC系统,成为了市场的主流)。

从传统的理念来讲,RISC的处理器由于指令简化,长度统一、在核心设计上相对简单,它的核心理念是通过一系 列的指令组合完成一项复杂的工作,并且简单的核心也于主频的提升,但对于应用的编译有着更高的要求(多条指令的高效运用)。CISC则正好相反,它的指令 集本身就可以完成一系列的操作,所以一条指令的作用相当于RISC的多条指令,长度也不统一,从而让处理器内部的核心设计相对复杂,提升主频也较为困难。

其实x86处理器的设计者早就认识到了CISC的不足,所以也最大限度的借鉴了RISC的理念。现在的x86 处理器其实是一个CISC指令解码器+RISC执行架构的混合体,前者负责将x86指令转换为长度统一的若干微操作指令,再交由执行单元,因此这已经有了 RISC的影子,但由于x86的历史长达30余年,为了保证向前的兼容性,要保留大量的历史指令集,这对于指令解译器是一个巨大的负担,而且由于x86指 令集更复杂,为其乱序执行(为提高效率必须要做的)增加了不小的难度,这直接影响的就是处理器面对乱序执行时对处理单元开启与关闭的能耗控制(你不知道乱 序的指令会用到哪个单元),而这对于ARM的影响要小得多。

完全可以说,ARM与x86当前的表现差异,基本都是源自于RISC与CISC架构和ARM与x86指令集的 本质区别,不过这并不是一个绝对的好与坏的评价标准。比如IBM,其UNIX服务器Power System所采用的POWER处理器就是RISC架构,但是比其更高端的System z大型主机的处理器则是CISC架构。事实上,RISC与CISC在信息处理领域只是走了两条不同的路,可谓“殊路同归”,双方都会面对相应的困难,并运 用自己的智慧予以解决,从本质上讲,并没有绝对的优劣之分。

ARM由于架构与市场定位的先天原因,使其在面向轻量级简单应用方面有着明显的优势,比如手机、平板电脑等。 而x86核心更多的是为复杂操作任务所准备的,并且从一开始就没有对能耗有太多的关注。因为在x86诞生之日,移动设备基本上还是实验室中的玩具,而 ARM当初的着眼点就是低功耗平台。这就好比,ARM一直在做摩托车,x86一直在做轿车,当人口数量越来越多,交通越来越拥挤之时,人们越来越喜欢交通 便利且省油的摩托车,此时x86觉得可能会影响到自己轿车的销路,才开始研究摩托车,反过来ARM也想做高端人群的生意,除了做更豪华的摩托车之外,也开 始研究起如何做轿车了……数据中心市场显然就是“轿车市场”,ARM处于攻势,而x86处于守势。但可以肯定,摩托车与轿车所需的技能是有很大不同的。

那么,现实中的数据中心领域又是怎样的发展态势呢?随着互联网与移动终端的兴起,人们越来越依靠互联网从事各 种活动,与之相对应的就是企业互联网化趋势愈加明显——不管你是不是互联网公司,互联网都将是绝大多数企业进行商务经营的必要途径,比如电商的兴起、 SNS平台的诞生、比如传统企业、政府的互联网经营(电子政务,网上办公,甚至铁道部都开始网上售票了),所以我们能看到未来的企业在IT架构上日趋统 一,都是标准三层架构,即互联网Web接入——企业应用——核心数据库。而ARM也将在这其中找到自己新的战场。

当前企业典型的IT运转模型,与各层的主要处理器平台组成,从左至右,对于处理器的负载能力也由低到高

ARM目前相对于x86最大的优势就在于单位能耗的性能表现,这仍然与其架构设计有着密切关系,它非常适合那种操作较为单一、简单的应用,如果从企业IT环境的三层架构入手,很明显就是Web门户端将是ARM首先的登陆领域。

Web门户是企业接受用户需求,并反馈给用户结果的重要平台,但凡一家拥有一定互联网访问规模的企业,都会非 常重视前端的Web平台的建设,其中一个典型就是CDN(内容分发网络),它对于平衡Web访问负载、保证响应速度有着重要意义。不过它本身的处理操作是 相对单一的,更多的是考验I/O的能力,因此它需要大量的分发节点,每个节点有自己的I/O通道,但这个节点本身对处理能力的要求并不高——由此就引发了 新的思考与需求。传统的x86服务器性能强大,但在CDN应用中,有点大炮打蚊子的感受,因为CDN的能力视节点数量而定,单节点的性能再强,I/O能力 也是有限的,所以CDN讲究集群作战,并不需要个人英雄。而x86服务器单机的I/O能力是固定的,可CPU的能耗摆在那,为了获得更高的I/O吞吐能力 而配更多的服务器节点,也就意味着能耗的成倍上升。这就是一个典型的客户习惯的改变(移动化),进而引发企业的IT环境的应对(前端Web化)所带来的新 问题,所以越来越多的大型数据中心的主管,都在寻找性能够用、能耗更低的I/O节点来组建CDN,毕竟一个大型网络平台(如百度、腾讯、Facebook 等),这方面的投入将是成千上万台服务器的级别,对于厂商来说就意味着“真金百银”,这必然引发了ARM与x86阵营的遐想,变革也随之而来。

其实,ARM阵营中早就有厂商就此发力,Calxeda公司就是其中的典型,EnergyCore ECX-1000是它的代表性产品,在面对相对简单的Web请求处理方面,轻量级的ARM核心在能效比方面显示出强大的实力。

EnergyCore ECX-1000采用4个ARM Cortex-A9(A15的上一代)核心,加上内存的处理模块的总功耗也就是6W

EnergyCore ECX-1000与英特尔Xeon E3-1240(32nm SandyBridge核心)在Web请求负载方面的性能与功耗比较,虽然性能略低,但功耗更低,能效比是后者的15倍

而Calxeda的野心并不仅限于此,它的目标是从Web端进军企业应用平台,比如高性能计算。在一个典型的 EnergyCore ECX-1000服务器设计中,可以在一个2U的机箱中放置24个计算节点,总能耗最高也不过200多W,这是一个相当诱人的表现,从一个集群的架构讲, 光从能耗上看,较传统x86服务器的优势只要有小学数学程度的人都能明白。

EXC-1000平台能耗对比

24节点EnergyCore ECX-1000服务器在一些企业应用与基础测试中的能耗表现

与之相呼应,服务器厂商也蠢蠢欲动,准备将ARM解决方案带入数据中心,这其中惠普的“登月计划” (MoonShot)就是典型的例子。在这一计划中,我们可从惠普采用EnergyCore ECX-1000节点模块,面向开发者设计的Redstone服务器平台上,看到这类服务器未来的面貌与能力。

利用现有的ProLiant SL6500机箱,Redstone可装入4个服务器集群框架,每个框架有72个计算节点(微服务器),总共可以在一个4U的机箱内放入288个节点,机架密度达到了72/U,远远高于现有的刀片服务器

在一台基于ProLiant SL6500机箱的Redstone平台中,总共有288个计算节点,每个节点有4颗EnergyCore ECX-1000处理器,每个处理器有4个Cortex-A9核心,所以一台服务器就有4608个核心,这种密度在当前的数据中心里是不可想象的。为此惠 普也专门将其与传统的x86服务器解决方案做了综合比较,在满足应用需求的情况下,能耗降低89%,机架占用空间减少94%,成本降低63%,而复杂度也 降低了97%。

基于Redstone服务器的解决方案相较传统x86服务器方案的比较

作为x86世界的领袖——英特尔当然也注意到了这个倾向与趋势,不过它其实在早前也是ARM阵营中的一员,以 ARMv5架构设计了自己的XScale处理器核心,并开发出了PXA25/26/27系列处理器,应用于当时的PDA与嵌入式市场。后来,英特尔的战略 发生了改变,全面转向x86平台,最终在2006年将XScale出售给了Marvell。其实,英特尔与微软在这方面的表现是相似的,作为x86生态圈 里的灵魂组合,它们的一举一动对于x86世界都有着深远的影响。微软希望用Windows统一移动、桌面与数据中心平台,而英特尔也希望用x86平台覆盖 这三个市场。

英特尔面对大规模Web接入与密集集群应用市场的主要应对平台就是Atom与单路至强服务器(目前是E3系 列),不过目前来看,重要的竞争压力落在了Atom身上,因为它的性能在单路至强之下,也就将率先面对ARM平台的冲击。不过,Atom进入数据中心多少 有点“无心插柳”的感觉。Atom最早并不是按数据中心应用设计的,而是面向轻客户端设备,最知名的莫过于风行一时的上网本,但很快,Atom的性能表现 在x86主流市场被一片诟病,但其相对低得多的能耗表现又成为抢食自家兄弟市场的一大亮点(为此英特尔甚至为Atom的外围配置,如屏幕尺寸等进行了严格 的限制)。在某种程度上,它成为了笔记本电脑市场上一款比较尴尬的产品。但OEM厂商的创造性发挥也让英特尔看到了在其眼中“低能低耗”的Atom产品家 族的一个新用处——构建高密度低能耗的微服务器,同时英特尔在半导体生产工艺方面的强大优势,也使得Atom有更多的低能耗挖掘潜力。

需要指出的是,到目前为止,Atom在微型服务器方面的采用率要明显好于ARM平台,即使是惠普的登月计划也 没有忽略Atom。究其原因,除了ARM本身是新来乍到之外,还有其他因素,这方面下文再说。而再往上一层,x86则有更强大的单路至强E3平台与皓龙 3000系列,但它们功耗更高,在面对轻负载重I/O(CDN就是典型的一种)应用时,明显是杀鸡用牛刀,不过在传统的应用领域,E3的性能仍然是ARM 平台不可比的。

在E3与皓龙3000之后,还有E5与E7和皓龙6000系列,以目前它们的主管的领地来看,ARM在很长的时间里都不可能威胁到它们的地位,这也是为什么AMD仍然会坚守x86数据中心市场的原因。

至此我们已经清楚了ARM与x86在数据中心市场交火的背后原因与基本的范围。那么,ARM处理器在数据中心里的征途将会如何呢?它无疑会关系到AMD这一步棋的后继效果,反过来说,AMD对ARM的帮助又将给这场数据中心的前端争夺战带来怎样的变数呢?

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章