你可曾了解,在高频交易市场中,仅仅纳秒级别的时间差距就能决定几百万美元的盈亏?在金融市场中,高频交易(HFT)已经成为一场“超低时延的‘竞速赛’”。它依赖复杂的算法和尖端的硬件设备,以极快的速度完成tick(市场价格的最小变动单位)交易的全过程,捕捉市场中的微小价差,从而获取巨大的利润。
高频交易在全球资本市场中扮演着重要角色。它提升了市场的流动性,并加快了价格发现的效率。Deloitte 2023年金融科技报告显示,高频交易在美国股市交易量中占比超过50%,并且这一趋势在全球范围内不断扩展。然而,超低延迟、庞大的数据处理量,以及复杂的监管环境,都给高频交易带来了巨大的挑战。
高频交易的核心在于速度,这种交易模式具有三类特点。
其一是对低时延的极致追求,几微秒的差距就可能决定盈利与亏损之间的巨大差别。
其二是高频交易对基础设施要求极高,很多公司选择在交易所附近部署服务器,甚至直接租用交易所的设施,以确保获得最优的时延。
其三,先进的算法和自适应计算为高频交易带来了明显的竞争优势,不仅提升了交易效率,还在合规性上助一臂之力。
“一直以来,AMD持续通过高性能和自适应计算技术助力整个金融行业的数字化转型,为银行、支付、保险和资本市场等带来显著的效率提升和创新支持。”AMD 自适应和嵌入式计算事业部( AECG )Alveo加速卡高级产品线经理 Shyam Chander介绍说,这一次,为了应对高频交易面临的诸多挑战,AMD推出了AMD Alveo™ UL3422 金融科技加速卡。
AMD 自适应和嵌入式计算事业部( AECG )Alveo加速卡高级产品线经理 Shyam Chander
超低时延、快速传输、高性价比
在高频交易(HFT)中,对速度的追求无疑是最严苛的技术需求之一。这种严苛性体现在每一纳秒的交易竞争中,而交易成功与否可能直接决定企业的盈利与亏损。AMD Alveo™ UL3422通过专属打造的 FPGA 提供前所未有的超低时延表现,以适配高频交易的应用场景。
AMD Alveo™ UL3422 作为专为高频交易(HFT)领域设计的FPGA架构加速卡,其超低延迟和硬件自适应能力使交易加速更加高效可靠。通过灵活的可编程特性,AMD Alveo™ UL3422 可以帮助交易商快速调整算法,以应对市场的剧烈波动和瞬息万变的环境。这种实时调整能力在金融市场的“闪电崩盘”或其他极端事件中至关重要,能够有效减少损失并捕捉短期的交易机会。
AMD Alveo™ UL3422的核心优势在于其超低时延的交易执行能力,特别是针对“tick-to-trade”的需求。其AMD Virtex" UltraScale+" VU2P FPGA芯片具备专门构建的超低时延GTF 收发器,能确保交易反应速度达到纳秒级,这对于高频交易至关重要。在实际应用中,交易商通常通过将交易服务器共置在交易所主机附近,进一步降低了数据往返的延迟,从而在市场价格变化的第一时间做出反应,最大限度地捕捉市场机会。
此外,AMD Alveo™ UL3422的硬件设计在空间利用方面也非常出色。全高、半长(FHHL)的紧凑设计,使得那些受限于机房空间的金融机构可以更灵活地进行共置部署,从而提升整体计算能力和系统部署的效率。单片架构的设计降低了多插槽、多模块之间的复杂性,使得系统部署和维护更加便捷,这对于需要迅速响应市场变化的企业尤为重要。
在数据传输与处理方面,AMD Alveo™ UL3422配备了板载内存和高带宽网络端口,确保每个数据包都能被快速、准确地处理。特别是在高频交易和风控管理中,这种高效的数据处理能力至关重要。利用FPGA的扩展操作进一步提升了在多卡片部署时的灵活性,帮助交易商在高负载下实现复杂算法的高效运作,确保交易前的风险评估和数据分析能够快速完成,从而减少交易失误,符合合规性要求。
“六边形战士”产品组合 满足超低时延到标准化的多样需求
AMD的算法交易产品组合可以有效满足金融机构从超低时延到标准化低时延的各种需求,Shyam Chander以三类场景为例,分别展示了速度的重要性以及算法简洁性的变化。
时延低于20纳秒的超低时延场景,对速度的要求最为严苛,主要采用FPGA来实现。其主要目标就是追求速度极致,因此所使用的数据量较低,算法也相对简单、简洁明了。这一类的算法主要应用于做市商交易以及套利交易,注重高度简化的算法结构。
在时延相对较高,但仍属于低时延范畴(通常低于100纳秒)的场景下,适用于低时延FPGA交易。这其中包括了FPGA和自适应的SoC的应用。这类交易在时间要求上可以适度放宽,同时算法的复杂程度相对有所增加,涉及的数据量也更大,通常会对历史模型进行更加深入的分析。
而对于传统的CPU交易方式,其时延低于1000纳秒,在这种场景中,数据主要通过CPU主机来进行处理和计算,数据传输则依靠网络接口控制器(NIC)来实现。这种交易方式尽管在速度上不如前两类,但更适合对复杂数据的处理和计算。
Shyam Chander表示,在所有用例中,速度都是极为关键的因素。
而为了满足金融机构从超低时延到标准化低时延的各种需求,AMD推出了一系列专为高频交易设计的产品。Shyam Chander透露,AMD Alveo™ UL3422和AMD Alveo™ UL3524是专为追求极致速度的超低时延场景而设计的,适合做市商和套利等简单快速的用例,其时延低于20纳秒。而AMD Alveo™ V80提供了低于100纳秒的FPGA交易解决方案,适用于更复杂的算法分析与数据处理。AMD Alveo™ X3522以及AMD的EPYC和锐龙CPU则支持低于1000纳秒的低时延CPU交易,适合需要高计算资源的复杂交易场景。
“通过这些产品,AMD帮助金融机构在不同复杂度和需求下找到最适合的交易加速方案,保持市场中的竞争力。”Shyam Chander如是说。
而值得注意的是,在超低时延场景下的产品组合中,AMD Alveo™ UL3422 仅有 AMD Alveo™ UL3524 加速卡一半的尺寸,却提供了同等性能,后者保持着当前 STAC-T0 基准测试 tick-to-trade 性能世界纪录。
同时,面对共置服务器的机架空间有限的挑战,AMD Alveo™ UL3422的纤薄设计和优化功能集使其非常适合1U服务器的部署,更是灵活适用于2U和4U服务器的配置,以进一步提升加速卡的部署密度并降低共置费用。
此外,AMD Alveo™ UL3422还支持使用FINN编译器进行PyTorch开发和神经网络量化,为交易公司在低时延条件下执行传统算法的同时,也能利用机器学习技术实现策略优化。其高度集成的计算与存储能力,加之FPGA和DSP块的结合,使得交易算法的硬件加速成为可能,确保高频交易中所有步骤的高效进行。
开发无阻 部署无忧
在高频交易领域,快速迭代和灵活适应性也至关重要。相比传统的FPGA开发,AMD的金融加速卡产品具备极高的灵活性,使得高频交易公司可以不断优化其交易策略,同时适应交易、算法和监管环境的持续演进。Shyam Chander表示,开发者可以借助AMD的Vivado™ 设计套件进行RTL设计,并通过专门的时延基准测试参考设计来评估性能和集成自定义算法,确保系统的最佳表现。
此外,AMD提供了丰富的IP工具包及生态系统解决方案,显著加速了部署过程。无论是通过内置IP还是与合作伙伴(如Exegy)提供的解决方案,这些工具都能帮助实现超低时延。“我们提供的运行时堆栈和API也进一步简化了开发者的工作流程,帮助他们快速响应市场需求。”Shyam Chander如是说。
Shyam Chander进一步补充道:“AMD的系统解决方案也适用于工业标准框架,其中,FPGA可以利用机器学习开发框架实现低时延处理。例如,使用FINN编译器可以支持PyTorch开发和神经网络量化,最终通过FINN进行编译并生成RTL IP。
“目前相关参考设计、工具与生态系统的IP都已经推出。同时,AMD Alveo™ UL3422D也已经在量产当中。”Shyam Chander说。
(注 本文图片来源AMD)
好文章,需要你的鼓励
智谱AI率先推出了 AutoGLM,试图打造一款能够理解、规划、执行,并最终实现“无人驾驶”操作系统的 AI Agent。
该处理器采用16nm工艺技术设计,拥有 48 个ARM Cortex-A75内核,六通道DDR4 3200 MHz 内存 - 每插槽高达 768 GB(每通道 128 GB)
谷歌DeepMind研究人员则直接把这项技术集成到AI Agent中开发了Talker-Reasoner框架,让其具备“快”、“慢”两种拟人化思考方式。
数据密集型工作负载的激增,导致计算系统需要处理的数据量大幅增加。这种不断拓展的数据环境,迫切需要具备更大容量和更高带宽的