ZD至顶网服务器频道 11月20日 编译:就在昨天,英特尔公司悄然发布了一项面向其芯片产品线的大规模升级方案:芯片巨头将在近期推出一款将CPU与FPGA加以集成的新型至强处理器。这款至强+FPGA的新组合将接入标准E5 LGA2011插槽,而集成于其中的FPGA将允许每块芯片以定制化方式处理特定工作负载。这一举措显然是希望能够让英特尔x86架构成为一套更加出色的广泛计算平台,从而应对各企业与数据中心内多种工作负载的具体需求,同时拉拢那些原本希望从英伟达等厂商手中购买GPGPU加速方案的客户。
这款至强+FPGA的新方案也给带来了新的争论,即英特尔公司是否会考虑将FPGA引入其消费级酷睿芯片产品线——表面上看可能性不大,但必须承认下一代游戏与应用程序将在FPGA对核心处理进行提速后实现更理想的运行效果。我们将在文章结尾对此进行讨论。
FPGA究竟是什么?
首先让我们聊聊现场可编程门阵列(简称FPGA)。顾名思义,FPGA在本质上相当于一块能够在制造完成之后进行多次重新编程的空白芯片。除了极少数例外情况,我们计算机设备当中所使用的每一块芯片几乎都采取硬编码机制(即在制造时即完成编码),从而执行单一功能集。我们的CPU只能够完成英特尔或者AMD为其制定的设计处理目标。大家无法将自己的CPU转化为GPU。但在FPGA方面,我们能够对其进行编码以执行特定功能集(例如图形处理),而后再重新编程以处理其它类型的工作负载(例如某些数据库操作任务)。
FPGA的主要优势除了这种可定制性之外,还体现在其卓越的性能表现方面。虽然ASIC是目前为止针对特定工作负载时速度最快且执行效率最高的处理方案(因此我们常用它来进行比特币挖掘),但FPGA在速度与执行效率方面同样相当出色。尽管尚无法在这两方面与ASIC相比肩,不过在牺牲部分速度表现的同时大家也能够获得可重复编程这一独特能力(再次强调,ASIC在制造时即设定了所能处理的负载类型)。
为什么英特尔要将至强CPU与FPGA加以结合?
在过去几年当中,开始有越来越多的处理任务由本地转向云环境之下,而英特尔公司在服务器市场上的霸主地位也因此受到多方面冲击。至强芯片确实是一款出色的综合性处理方案,但在部分情况下,我们需要利用其它更具针对性的芯片来处理某些特定工作负载。正是因为如此,人们才开始在Web服务器上考虑使用价格更亲民且功耗更低的芯片(其根本不需要价格昂贵而发热量惊人的至强芯片),而GPGPU加速方案则能够实现强大的并行处理效果(因此在超级计算机当中占据着一席之地)。对于这些特定工作负载,英特尔公司陆续推出了轻量级凌动处理器、面向超级计算机的50核心至强Phi协处理器以及如今的至强+FPGA(目前其似乎尚未获得正式名称)。
英特尔公司希望能够利用至强Phi等自家并行芯片方案对抗GPGPU加速产品
英特尔公司还指出,其单在去年一年就已经推出了“15款定制化产品”以满足Facebook以及Ebay等大型客户的实际需要(可能就是以至强为基础对缓存大小以及计算核心数量进行微调),而今年年内其还将推出超过30款定制化设计方案。
那么此次公布的新型至强+FPGA产品的目标何在?根据英特尔方面的说法:“FPGA能够为我们的客户提供可编程且性能出色的加速能力,从而显著提升其关键性算法的执行效率。”英特尔公司预计至强+FPGA能够实现高达20倍的性能提升效果(当然,只限于那些在FPGA之上执行而非依赖传统x86 CPU的代码——不过很明显,由于瓶颈的消除其整体速度提升也将相当可观)。而另一大优势则在于工作负载变更——如果大家对自身的关键性算法进行了调整,或者整个企业的业务核心发生了转移,那么FPGA仍然能够切实起效、确保我们无需为此而购置新的硬件平台。
一块八核心至强CPU,其缓存位于芯片中间位置,而多个控制器/IO则排布在左侧与右侧边缘
就目前的技术指标而言,我们只能给出有限的猜测性结论。Altera公司很可能负责相关FPGA芯片的制造工作,其与英特尔一直保持着密切的合作关系(其还是首批获准使用英特尔公司严密保护下的芯片代工设施的厂商之一)。FPGA一般拥有庞大的体积(这是使用可编程门所承受的必要之痛),而LGA2011至强E5芯片封装基板上显然没有太多闲置空间,因此我们猜测双方会想办法努力压缩FPGA的体积。另外,如果FPGA能够利用至强的自身缓存,及其它部分低级资源,那么可能会在一定程度上提升空间利用效率。(英特尔方面指出,至强与FPGA之间存在一个‘低延迟一致性接口’,但并没有具体加以解释。)
芯片巨头并没有给出这款产品的具体价格或者上市时间——不过很明显,其绝不是款便宜的产品(目前顶级至强处理器仍然要价数千美元)。英特尔公司希望这套至强+FPGA方案能够让企业客户意识到x86架构仍然大有可为,从而阻止他们转移至竞争对手的架构方案当中(例如英伟达打造的Tesla GPGPU)。毕竟从实现难度方面看,对一小部分关键性代码进行重写以将其运行在FPGA之上,要远比利用OpenCL重写整款应用程序简单得多。
最后让我们再做点思维拓展:如果这次小小的至强+FPGS实验性尝试获得了成功,那么我们何时才会见到酷睿+FPGA芯片的面世呢?抑或是GPU+FPGA产品?想象一下,如果我们可以将游戏引擎的核心部分交由FPGA负责打理——例如物理引擎或者敌人AI,或者是将PC设备操作系统的核心部分由FPGA运算,简直想想就让人激动。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。