ZD至顶网服务器频道 08月24日 编译:不久前的IDF(英特尔开发者论坛)大会上主流市场芯片和开发商消息漫天飞舞,笔者与同事却注意到几个不那么耀眼、但却同样紧迫的话题。虽然这些事情可能无法与电脑和消费市场相提并论,因其不是那么吸引公众的眼球,我们关注的话题事关未来几年里整个服务器空间的设计方向。
就数据中心而言,今年的IDF上最热门的话题有两个,一是对Optane 3D XPoint内存的更深刻认识,网上可以找到更详细的资料。另一个热门话题是与会者可以搜集到英特尔和Altera FPGA关系的新兴技术和市场前沿的信息。具体来说,从英特尔院士Al Gara和Altera公司策略总监Mike Strickland那里,我们对新兴力量朝什么方向推动整个局面发展有了那么一点点更深的体会,先是序幕,只是受金融好奇心的驱使,目前进入了有着一种广泛支持的研究现状,而下一步是实际产品,期望在各种潜在范围内适应未来数据中心的需求。
至于坊间传出的关于FPGA和Xeon的结合说法,背后两个头之间的洽谈可以用两个字概括:信心。基本的感觉是,他们知道一些各方读者和分析师不知道的事。说到底,如果英特尔分出167亿美元给一个一直在喊着要走自己的路的公司,那整件事不会只是局外人表面上看那么简单,对吧?
回到我们自己提出的问题,初步的猜测是,一些领域的新应用可能利用FPGA的优势,从而谋求大规模增长的潜力,又或者,由FPGA驱动的交换市场爆炸性发展,又或者,市场甚至对一种特别的(针对GPU或高测试CPU)加速有极大、无法满足的需求,比如大型云供应商可以用得上这种加速。如果Stickland和Gara给出的提示没有被理解错的话,那所有这些东西都是真的,而且,其规模是我们所预料不到的,是些即便是短期内服务器市场都无法切入的东西。
这里的重点并不完全在实用上以及FPGA和英特尔处理器的技术结合上,重点更多的在于该项宏大的挑战本身。显然,性能上的限制在往前发展时是存在的,有摩尔定律的限制,除此以外,功率限制也越来越大。这才是此项交易的关键所在。Gara在IDF上告诉笔者,“当功率受到限制时,要实现一些功能就要找一些特别的方法,以追求性能和平均每瓦的性能,这样做是非常有益的,能够提供不同层次的性能。”
Gara表示,“我们认识到我们能够将大量功能整合到我们的芯片里,我们也就有了加入更多特别功能的机会,利用FPGA,我们有机会做到这一点,而且是以一个更普遍的方法,一个独特的特定功能不仅仅只是为了一个客户,它可以为我们提供更多的共性。”
上述说法颇为激励人心,但算不上未来的路线图,Gara表示,他认为FPGA功能大致可以朝多方面发展。“就是说,可以向离散和外部设备方面发展,就目前外部设备的状况而言,FPGA可以进入包装,甚至存在向处理器核心方面发展的潜力。这一块的机会一大把,我不是说我们对于所有这些已经搞透彻了,我们确切地知道我们要去哪,但却也是一个大机会。”
从下图中可以看到上述各点,其中的QPI链接通过PCIe卡提供高带宽和高速度。有了这个以后,假定其编程模式用的此处所给出,那么稍微想想即不难猜出,英特尔和Altera心里想的模型将会遵循一个一致性模型(Coherency model)。这样的做法可能会延伸到未来时代,届时,一切都是在统一的芯片上完成,芯片上类似于我们现在用的CPU和GPU一类的共享内存架构可以让一切出现在一个地方。FPGA似乎也可以拥有自己的PCI-Express适配器插槽,即是说,别的东西可以直接与其连接,或是通过至强E5芯片连接。
Gara在IDF讨论会上谈话的关键是关于工作负载加速的概念。当然这不是什么新概念;事实上,它是处理器发展的一部分(曾记否,浮点单元也被视作加速器,直到后来被整合,现在到了到处都是浮点单元的地步)。对于英特尔来说,其演变花了一段时间,目前的例子是Xeon Phi,Xeon Phi整合了高吞吐量组件,这些组件经优化后成为高性能计算的关键工作负载。关键的一点是,工作负载加速的下一步是FPGA元素,从市场的角度来看,工作负载加速是多样化的,具有无限的可能性。其应用区域包括超大规模和云细分市场,二者极有可能成为英特尔与Altera的FPGA大实验场,用于实验应用程序和节点级别的加速。
用于大型云的快速数据包
目前还很难确定的说大型云供应商是如何看待FPGA潜力的,但可以保险地说,他们很可能也非常了解加速可以在诸如机器学习和其他应用程序中不同的工作负载方面发挥作用,在节点上也有用。例如,我们早就知道微软在关注FPGA,特别是他们的Bing搜索引擎也使用加速。不久前,微软Azure集团首席技术官Mark Russinovich谈到Azure可以采用FPGA提升智能网卡性能以加强数据包的处理。
Russinovich在今年6月的开放网络峰会上就其他大型云服务提供商的方向或许颇为一针见血地指出,“扩展到40 Gbps或以上需要对数据包处理进行非常大量的计算。微软正在Azure SmartNICs上构建网络接口控制器(NIC)转移,无需消耗CPU资源但可以帮助我们扩展,如此,这些CPU资源就可以提供给客户虚拟机用。”这位云计算CTO表示,尽管FPGA中还没有在服务器上广泛用于计算加速,但他的团队正在积极地利用FPGA“和SDN的可编程性达成快速规模化,专用硬件的性能在业界是独特的。”
对于大云供应商来说,关键是可编程性、可移植性和灵活性,当然,对于其他通用用户来说也是这样。人们一般不会很自然地选这几条来形容FPGA,但英特尔(主要是旗下的芯片业务和HDL经验)多年来在这一块做了大量的工作,Altera公司也在许多相同的问题上辛勤地耕耘着。
当然,FPGA和加速器前沿的发展受益的不单单是云供应商。Gara和Stickland均引用了一些诸如高频交易、科学计算、网络压缩、存储加、媒体转码的应用例子以及其他领域里未来重点发展的例子,这些有一部分是来自现存的工具软件,如英特尔的数据平面开发工具包、加密和压缩用的基于硬件加速的QuickAssist工具等等。
在一系列的发言里,Altera公司Mike Strickland是个中心话题,他围绕FPGA利用OpenCL到HDL转换器而推动编程方法概述了一些新的和有意思的资料。关于这一点,如果翻一翻那个幻灯片就可以很明显地看到,编程环境正在发展。笔者以前曾介绍过,现存的OpenCL编译器可以处理大量繁重的后端工作。Strickland表示,FPGA因此可以在OpenCL以外拥有更广泛的基础,例如和OpenMP结合。 他称,“我们的一些用户用惯了HDL,他们仍然可以继续用,但可以配合OpenCL内核混合用(最终要发展到OpenMP内核)。这里多了一个新的灵活性。”
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。
主动型 AI 是人工智能的下一次进化,它不仅能生成内容,还能自主决策和追求目标。这种 AI 可以设定自己的目标,制定策略并根据情况调整方法,实现真正的自主性。它将彻底改变机器与世界的互动方式,为人机协作开启新的可能性,但也带来了透明度和伦理等挑战。