至顶网计算频道 10月31日 新闻消息(文/邹大斌):日前,Achronix与Molex旗下的FPGA加速器产品供应商BittWare联合宣布:推出一类全新的、面向高性能计算和数据加速应用的FPGA加速卡。
新推出的VectorPath S7t-VG6加速卡搭载了Achronix今年新推出的Speedster 7tAC7t1500独立FPGA芯片,该产品采用7nm工艺打造,在同类PCIe FPGA加速卡中提供了目前业界最高性能的接口。这些高性能接口包括1x400GbE和2x100GbE接口,以及总带宽为4Tbps的8组GDDR6的板上存储器,使该加速卡成为高带宽数据加速应用的理想选择。
众所周知,当下越来越多的企业纷纷引入人工智能技术,相应地带来了对计算能力的旺盛需求,也带火了数据中心加速器市场。根据Research and Markets的研究数据,数据中心加速器市场将从2018年的28.4亿美元增长到 2023年的211.9亿美元,年复合增长率(CAGR)达到49.47%。这其中FPGA以其在人工智能训练场景中的独特优势,而成为年复合增长率最高的细分市场。
“对于许多应用(比如很多AI应用训练场景),FPGA比GPU和CPU有更高的性能、功耗比率,同时与ASIC相比,FPGA又具有可重配置的特性,因此,有着广泛的应用前景。”Achronix市场营销副总裁Steve Mensor表示。
Achronix市场营销副总裁Steve Mensor
实际上,很多大型企业早就已经将FPGA引入了自己的数据中心,比如,在微软Azure和亚马逊AWS等巨头的大型和超大型数据中心内都已经广泛部署FPGA。
Steve Mensor说:“这些巨头们有着很强的技术能力和人才资源,所以它们可以自己把FPGA整合到自己的计算平台中,用以加速应用。而众多中小公司受限于自己的技术实力,要享受到FPGA的好处,就需要第三方的帮助,VectorPath S7t-VG6加速卡的到来就可以满足它们的需求。”
据悉,专为高性能和高带宽数据应用设计的VectorPath加速卡具有以下硬件功能:400GbE QSFP-DD和100GbE QSFP56接口;8组GDDR6存储器可提供4 Tbps的总带宽;1组带有错误检查和纠正(ECC)功能的、运行频率为2666MHz的DDR4存储器;符合PCIe的要求并获得了认证;Speedster7t FPGA芯片集成了带宽为20 Tbps的二维片上网络(NoC);692K的6输入查找表(LUT);40K Int8 MAC提供高于80 TOps的算力;OCuLink – 用于连接扩展卡的4通道PCIe Gen 4连接器。
VectorPath加速卡还包括一整套Achronix的ACE开发工具,以及BittWare的基板管理控制器和开发工具包,其中包括API、PCIe驱动程序、诊断自测和应用示例设计,以提供快速的、开箱即用的体验。专为原型设计和大批量生产应用而设计的VectorPath S7t-VG6加速卡使设计人员能够处理极大量的数据,这是前几代FPGA无法做到的。
值得一提的是,VectorPath中采用的Speedster7t FPGA系列芯片为高带宽数据加速应用提供了全新的性能和适应性。一个是其内置的人工智能/机器学习(AI / ML),大幅提升了人工智能应用的性能;另一个是它革命性的2D片上网络(NoC)技术,其带宽容量超过20 Tbps,可将数据从高速接口移动到FPGA逻辑架构,或跨越FPGA逻辑架构进行数据移动。该2D NoC通过在每个方向上为每个NoC行和列提供256位的单向总线和总计512 Gbps的带宽,从而缓解了数据瓶颈。NoC的主要接口是行业标准的AXI通道。在ACE 8.0设计软件中,现已提供对Speedster7t AC7t1500器件的初始软件支持。
VectorPath S7t-VG6加速卡将于2020年第二季度初开始供货。企业有多种方式可以买到VectorPath:一是可以通过BittWare采购VectorPath加速卡,另一个是可以通过其OEM供应商(如戴尔、HPE等)采购集成了VectorPath加速卡的服务器。另外,也可以直接采购BittWare的TeraBox FPGA Server,这是BittWare为VectorPath定制的服务器。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。