作者:Achronix
随着人工智能/机器学习(AI/ML)和其他复杂的、以数据为中心的工作负载被广泛部署,市场对高性能计算的需求持续飙升,对高性能网络的需求也呈指数级增长。高性能计算曾经是超级计算机这样一个孤立的领域,而现在从超级计算机到边缘解决方案,在各个层面都可以看到高性能计算,随着我们推动更快的解决方案进入市场,网络安全和高复杂性应用在其中也扮演着更重要的角色。

为了满足对网络加速的需求,并提供灵活的、可重新编程的网络,Achronix为数据中心运营商、云服务提供商和电信公司提供Achronix 的Network Infrastructure Code(简称ANIC)和基于Achronix Speedster7t FPGA芯片构建的SmartNIC。这些可编程的加速器集成了前沿性技术,如400 GbE连接速度、PCIe Gen 5.0功能、片上网络和高速并行处理,以提供无与伦比的性能、可扩展性和灵活性组合。
ANIC是一套由模块化FPGA IP组成的完整设计,提供专为高性能网络流水线进行了优化的SmartNIC解决方案的所有基本功能单元。它有力地支持400 GbE和PCIe Gen 5.0功能,使各类用户能够根据其特定要求快速开发高带宽SmartNIC解决方案,满足其随着条件的变化而变化的要求。
更好的性能,更高的灵活性
为了提高网络性能,越来越多的客户转向SmartNIC,因为它可以通过卸载数据包处理和加密等日常任务来减轻主机服务器CPU的负担。除了节省CPU周期带来的经济效益之外,卸载还可以提高整体系统性能和资源效率。SmartNIC还具有可定制和可编程性,使用户能够灵活地适应不断变化的网络需求。
InfiniBand(简称IB)是用于高性能计算的传统网络技术。尽管IB的性能很好,但对于部署在传统数据中心(用以太网来作为标准网络协议),它却不能提供其中的HPC高性能计算解决方案所需的灵活性或功能密度。Achronix的ANIC解决方案支持400 GbE,可实现快速的数据传输速率,同时还提供了在网卡(NIC)上部署网络应用的能力;这一功能可显著提高应用性能并降低事务延迟。基于FPGA的ANIC方法具有出色的确定性,并始终提供极低的应用延迟,从而使ANIC成为具有严格实时处理需求的应用的首选。
SmartNIC架构的一种实现方法是将计算单元(如Arm内核等)添加到高性能网络数据路径中,以实现灵活的且可编程的网络。虽然添加CPU内核确实可提供网络卸载和应用加速功能,但处理器内核所能提供的网络性能也受限于其自身。功耗和空间限制将单张网络卡上可部署的内核数量限制于10个,从而使指令集受到限制,性能也就受到限制。
ANIC没有使用性能受限的Arm内核,而是运行在高性能的Achronix Speedster7t FPGA器件上,并且ANIC的模块化架构简化了组件选择过程并加快了设计阶段。此外,Speedster7t FPGA器件的部分重新配置功能支持实现动态调整,从而能够满足不断变化的需求。这种部署敏捷性可以节省大量的时间和成本。
“这是性能上的一个数量级飞跃,”Achronix SmartNIC产品规划总监Scott Schweitzer说道。“在ANIC上用一微秒内就可完成的工作在Arm内核上则可能需要几毫秒,而可在几纳秒内完成的工作可能需要几微秒。”
基于ANIC,用户有机会去部署自定义的IP功能。这种自定义的IP功能为定制应用打开了大门,如键值存储、入侵防御、重复数据删除和其他网络功能,所有这些应用都以400 GbE的网络速度运行。
在高性能计算中使用由FPGA加速的智能网卡:游戏规则改变者
高性能计算环境需要卓越的处理能力、高效的数据移动速度和高速的互连能力才能实现最佳性能。各种SmartNIC,尤其是像Achronix提供的基于FPGA的解决方案,可以无缝地满足这些要求。
在高性能计算中采用基于FPGA的SmartNIC带来的主要优势之一是定制化。凭借Speedster7t可重新编程的FPGA具有400 GbE以太网和PCIe Gen5功能,是高性能计算集群的多功能构建模块。
Achronix打造ANIC的目的是使用户能够优化其网络数据路径并加速网络应用。ANIC提供了一个完整的SmartNIC流水线,包括数据包接口、FIFO缓冲区、报头/解析器、流表格、规则引擎和DMA引擎。每种功能单元可以根据客户的需要去选择或取消,从而实现全部或部分数据包加速,并在Speedster7t FPGA器件上为客户自定义的网络加速功能应用预留高达50%的逻辑资源。
Speedster7t FPGA器件还提供二维片上网络(2D NoC),该项设计可在FPGA芯片内提供高达20 Tbps的带宽,并进一步增强模块化应用的部署。每个ANIC模块通过利用80个网络接入点可以实时放置在FPGA上或对其进行升级。
“ANIC的逻辑模块可以像乐高积木一样组合起来,以创建量身定制的SmartNIC解决方案,”Schweitzer说道。“根据想要完成的工作,客户可以选择使用部分或全部ANIC功能单元来组装解决方案。”这种模块化可组合性可确保用户只使用其特定应用所需的模块,从而消除了不必要的开销。
在HPC中,加速的I/O至关重要。SmartNIC允许超快速数据移动,从而有助于大型数据集的快速处理。如在DDoS缓解应用中,要求更深入的数据包检测,ANIC基于FPGA的高度并行设计支持高效的数据包处理,从而确保及时识别和缓解威胁。
在高性能计算和数据驱动应用的时代,Achronix提供的基于FPGA的SmartNIC可提供无与伦比的速度、卸载的处理能力、增强的安全性和卓越的灵活性。无论是寻求高速数据处理,减少延迟还是提高整体效率,SmartNIC都为高性能网络的未来铺平了道路。随着数据的不断激增和应用的要求越来越高,对于任何希望在高性能网络和计算方面突破极限的人来说,SmartNIC代表着一项至关重要的创新。
好文章,需要你的鼓励
美国多州和部分国家要求特定应用进行年龄验证,澳大利亚已禁止16岁以下用户使用社交媒体。新提案《应用商店问责法案》建议由苹果和谷歌负责统一验证用户年龄,而非各开发者单独验证。这将提升用户体验,用户只需向苹果或谷歌验证一次身份。凭借苹果在隐私保护方面的优势,该方案可扩展至Safari浏览器,为需要年龄验证的网站提供确认信息,而无需透露用户个人数据。
香港大学团队开发的"炼金术师"数据筛选系统,能从海量图片中精选一半高价值数据,训练出比使用全量数据更优秀的AI图像生成模型。该方法通过观察模型学习反应判断数据价值,发现适度复杂的图片比简单图片更有训练效果,实现了5倍训练加速和显著性能提升。
AI编程助手Cursor背后的公司Anysphere宣布收购AI代码审查工具初创公司Graphite。据报道收购价远超Graphite今年早些时候B轮融资时2.9亿美元的估值。此次收购具有战略意义,将AI代码生成与AI代码审查工具相结合,可大幅提升从编写到交付的整体效率。Anysphere估值已达290亿美元,近期频繁收购,上月收购技术招聘公司,今年7月还收购AI客户关系管理初创公司Koala的团队。
哥伦比亚大学等机构研究团队发现,在AI模型的强化学习训练中存在一个悖论现象:阻碍探索和阻碍利用竟然都能提升性能。研究揭示了裁剪技术实际是熵调节器而非学习信号,策略熵与性能无直接因果关系,并提出奖励错配理论解释随机奖励的积极效果,为AI训练方法设计提供了新的理论基础。