扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNet至顶网服务器频道 12月27日 编译:谷歌、Facebook以及其它一些主流技术企业已经开始着手研究ARM兼容芯片,旨在推动低功耗服务器并最终对数据中心内部的处理器类型结构加以改组。
想当初我们也是对x86完全信任、认为ARM麻烦多多,但随着后者的蓬勃发展、我们开始认真审视ARM架构的优势与缺点。就在上周四,彭博社发表的报道称谷歌正计划利用ARM芯片打造其服务器;随后我们又通过一篇博文得到证实,Facebook有意评估将ARM系统引入生产环境的可能性。
各企业用户对ARM芯片的兴趣如此高涨,主要是由于其在发展历程中始终秉持着低功耗这一优良传统;从诞生之时开始,这套处理器架构——于上世纪八十年代由Acorn Computers的一个小型团队所打造——就被设计用于RISC(即精简指令集计算)。这意味着ARM核心能以相对较快的速度执行大量简单操作;这种便捷性以及对传统支持机制的舍弃使其晶体管数量保持在较低水平,因此其耗电量也就低得多。
这种定制架构目前已经成为各类电池驱动的小型设备乃至嵌入式电子领域的绝对王者。在这些新兴世界中,处理性能并非关键——任何繁重费力的计算任务都可由专用处理设备接手——因此芯片本身的速度可以较慢,由此带来的好处就是其耗电量被控制在较低水平。
我们不妨将ARM与英特尔的CISC(即复杂指令集计算)设计进行对比,后者能够在更广泛的处理环境下发挥作用,同时拥有大量早期遗留技术需要支持——从16位实址模式一路发展至64位受保护长模式。英特尔的方案一般运行速度更高,但要求使用者为其付出极高的采购成本。而所有对计算资源的需求叠加在一起,我们就获得了这种功耗极高的处理芯片方案。
尽管ARM的拥护者们认为RISC从本质层面上更适合处理低功耗计算,但这一结论已经遭到专业学术机构的否定。后进指出,事实上两种架构之间的耗电量差别主要是由发展轨迹所决定——ARM在诞生至今的二、三十年当中一直专攻移动便携平台,而英特尔则始终关注摆在桌面上的那套大家伙。如果从本质层面分析当今的x86芯片,它其实是一套在设计上以RISC为核心、包裹着CISC兼容性外壳的计算方案。
ARM很长一段时间以来始终专注于压低电量消耗,这是由于其面向的主要市场在于移动以及非高性能计算设备,相比之下英特尔则一直强调处理速度的重要性;由ARM核心支持的芯片整体对电量的使用都比较温和。然而其缺点在于,即使处于全力工作状态、其性能表现仍然显得不紧不慢。
ARM的主战场,手机与平板。x86的根据地,游戏设备。即使是这样,谷歌与Facebook要如何切入?
为消费者提供服务的网络巨头们每年要花掉数十亿美元来建设基础设施并支付以百万美元为单位的高额电费账单。对于这些公司而言,数据中心在其年度预算当中扮演着主要成本制造者的角色。很显然,如果存在节省成本的可能,他们一定会尽量将其变为现实。
这里出现了一个关键性问题,一家企业到底能够把多少给定工作负载迁移到极简化、低功耗以及速度较慢的处理器之上?对于谷歌来说,其对于计算资源颇为敏感的后端需求似乎只能由强大的英特尔至强芯片来处理;但对于其它一些轻量级任务,例如前端Web服务以及存储控制等,部署ARM就很有现实意义。
Facebook的命题则更为简单——姑且不谈其刚刚成立的AI部门——因为社交网络的工作负载与谷歌相比对CPU处理能力的要求低得多。不过即使是这样仍然存在难以解决的问题:“我们希望看到的ARM服务器CPU需要……最低主频能达到2.5GHz,”Facebook公司技术战略负责人Vijay Rao今年十月末谈到,“只有这样我们的软件才能够获得由前端到后端的整体扩展能力。”
ARM服务器新兴企业Calxeda最近推出的32位Midway芯片的时钟频率大约在1.1到1.8GHz之间,因此很明显实际产品与客户需求之间还存在着巨大差距。(时钟频率并不能完全决定处理器的性能表现,但作为一般性评判标准、目前GHz数量对于使用者来说仍然非常重要。)
与此同时,64位ARM服务器也将于明年进入市场,其中一马当先的很可能是新兴企业Applied Micro——届时该公司将对这项技术进行基准测试及排名。
Facebook也已经基本确定开始采购商用设计计算机——其硬件供应负责人Frank Frankovsky前一段时间刚刚加入Calxeda董事会——而谷歌则可能决定更进一步、着手开发自己的定制化工具,其中包括具备ARM授权的处理器方案。
另外请大家不要忘了,ARM的业务模式在于销售其设计蓝图,销售的对象则包括AMD、三星、博通以及Calxeda等希望制造定制化芯片以适应自身产品及需求的客户。因此,谷歌将需要一位合作伙伴帮助自己进行芯片代工。
在此之前,Calxeda公司营销主管Karl Freund建议:谷歌方面还需要雇用大约五十名工程师并拿出一年左右的时间进行芯片设计——最终成果可能基于64位Cortex-A57——然后再花一年将设计方案与技术进行整合。总而言之,整个流程大约要花掉数千万美元。对于谷歌来说,其最近一个财季的净利润达到29.7亿美元,因此区区数千万的投入实在微不足道。
冷却中的服务器……Facebook的“冷门存储”阵列未来将与ARM设备比肩而立
下一步就是将谷歌的软件迁移到ARM系统之上。这位广告业巨头——百分之百采用Linux环境,至少在数据中心内是如此——一直在努力创造一套规模相对较小的统一化软件堆栈:我们可以设想其并未使用Facebook类型的x86 64位代码转换机制,那么其在ARM平台上的测试与部署对于谷歌员工来说应该非常简单——虽然还有大量关于优化的议题需要探讨。
该公司还在创建自有处理器所必需的专业知识方面投入巨资。早在2010年,谷歌收购了因苹果收购PA Semi而无处容身的隐形芯片设计商Agnilux。当时,该公司就已经在考虑如何在ARM与PowerPC服务器芯片之间作出选择。
“谷歌希望创造它、将其通过优化作为自身设施的组成部分同时又不想让Bing坐收渔利。”
在过去几年当中,谷歌已经悄悄收购了一家名为MetaRAM的新兴企业(现已停业)外加与之相关的多项DRAM及其它一些内存专利。
该公司还雇用多位硬件专家为其打造数据中心设备,而且有可能在其“Google X”高级产品研发中安插了多个隐秘的外包项目。
因此——谷歌确实有机会也有能力利用手头积累的专业知识打造出一些有趣的成果。正面我们转换视角,考虑这样一个问题:谷歌能从ARM身上得到哪些在x86中无法实现的回报?
“谷歌希望创造出成果、拥有这项成果并针对自身设施对其进行优化;另外,谷歌绝不愿意让微软的Bing用上自己苦心打造的方案,”某位在半导体行业内位高权重的消息人士告诉我们。
“谷歌可能会在知识产权当中包含对其软件有利的内容。他们也可能将大量IO作为其组成部分,”这位要求我们为其身份保密的消息人士补充称。“他们完全可以这样做,因为他们从MetaRAM手中买下了专利并对DRAM控制器进行了修改。我认为目前我们能够肯定的是,任何人只要手中掌握了对硬件、软件以及服务器系统的控制权,那么他就已经把数据中心的命脉抓在了手心。”
这位消息人士坚信谷歌打造属于自己的定制芯片极具现实意义,因为这样一来谷歌将具备更出色的保密效果、更完备的基础设施控制能力甚至有可能通过工作负载在定制硬件上的性能优化来改善系统运作效果。
不过英特尔在这一领域已经发展了很长时间,我们必须牢记由历史传统所带来的制造工艺与专业知识优势。换言之,与英特尔相比、谷歌能够成功开发出更出色的通用芯片实在可以算是小概率事件。
英特尔即将在明年推出14纳米低功耗芯片,这意味着优异性能将与相对较低的功耗正式携手。相比之下,ARM处理器将通过多家代工企业迎来井喷式生产,其中包括TSMC、Global Foundries以及三星等等——届时ARM将全面进入20纳米时代,并有可能在明年年底之前真正达到20纳米工艺水平。
“随着今年九月22纳米制程英特尔凌动C2000(简称Avoton)系统芯片的正式发布,我们已经开始踏上了属于自己的低功耗64位系统芯片发展之路,”英特尔公司发言人在接受采访时指出,“时至今日,英特尔凌动仍然是惟一一款能够在能源利用率与处理性能方面双双带来上佳表现的64位服务器系统芯片。从明年开始到更远的将来,我们将继续努力推动下一代14纳米制程系统芯片的面世。”
尽管英特尔在产品能力方面有过度宣传之嫌,但我们怀疑谷歌正在加紧计算、统计自己是否能够将大部分工作负载从x86平台中迁移到功耗更低、定制化程度更高的ARM环境下。虽然英特尔也愿意为Facebook以及eBay(谷歌可能也符合要求)这样的大型客户提供定制化方案,但其灵活性还远远无法与ARM上媲美。
对于谷歌来说,如果他们能够将数百万计算节点中的两成左右替换为自主研发的低功耗定制化处理器平台,那么为此所作出的一切努力都将物有所值。另外,虽然所有企业都希望能从理性角度出发处理问题,但芯片开发这类非常提气的决策无疑将受到谷歌员工的强烈支持。
不过谷歌方面并没有证实以上说法,该公司发言人Liz Markman在接受采访时回应称:“我们正在积极努力,希望设计出世界上最出色的基础设施方案,其中既包括硬件设计(涵盖各个层级)也包括软件设计。”
看起来对于那些规模极其庞大的技术企业来说,设计属于自己的芯片可能确实会带来诸多收益;虽然从通用角度看,其原始性能恐怕无法与英特尔或者AMD的成果相提并论,但节约下来的大量用电成本以及针对特定工作负载的性能优化完全可以成为推动芯片研发的决定性因素。
目前传闻频出的另一大主要目的是为了保证英特尔能够继续保持勤恳踏实的运营态度。Facebook公司硬件设计主管Frank Frankovsky最近指出:“我们推动ARM生态系统的作法对促进芯片产业的健康发展非常重要,其标志性意义不亚于当初AMD成功打造皓龙处理器”。