至顶网计算频道 10月31日 新闻消息(文/邹大斌):日前,Achronix与Molex旗下的FPGA加速器产品供应商BittWare联合宣布:推出一类全新的、面向高性能计算和数据加速应用的FPGA加速卡。
新推出的VectorPath S7t-VG6加速卡搭载了Achronix今年新推出的Speedster 7tAC7t1500独立FPGA芯片,该产品采用7nm工艺打造,在同类PCIe FPGA加速卡中提供了目前业界最高性能的接口。这些高性能接口包括1x400GbE和2x100GbE接口,以及总带宽为4Tbps的8组GDDR6的板上存储器,使该加速卡成为高带宽数据加速应用的理想选择。
众所周知,当下越来越多的企业纷纷引入人工智能技术,相应地带来了对计算能力的旺盛需求,也带火了数据中心加速器市场。根据Research and Markets的研究数据,数据中心加速器市场将从2018年的28.4亿美元增长到 2023年的211.9亿美元,年复合增长率(CAGR)达到49.47%。这其中FPGA以其在人工智能训练场景中的独特优势,而成为年复合增长率最高的细分市场。
“对于许多应用(比如很多AI应用训练场景),FPGA比GPU和CPU有更高的性能、功耗比率,同时与ASIC相比,FPGA又具有可重配置的特性,因此,有着广泛的应用前景。”Achronix市场营销副总裁Steve Mensor表示。
Achronix市场营销副总裁Steve Mensor
实际上,很多大型企业早就已经将FPGA引入了自己的数据中心,比如,在微软Azure和亚马逊AWS等巨头的大型和超大型数据中心内都已经广泛部署FPGA。
Steve Mensor说:“这些巨头们有着很强的技术能力和人才资源,所以它们可以自己把FPGA整合到自己的计算平台中,用以加速应用。而众多中小公司受限于自己的技术实力,要享受到FPGA的好处,就需要第三方的帮助,VectorPath S7t-VG6加速卡的到来就可以满足它们的需求。”
据悉,专为高性能和高带宽数据应用设计的VectorPath加速卡具有以下硬件功能:400GbE QSFP-DD和100GbE QSFP56接口;8组GDDR6存储器可提供4 Tbps的总带宽;1组带有错误检查和纠正(ECC)功能的、运行频率为2666MHz的DDR4存储器;符合PCIe的要求并获得了认证;Speedster7t FPGA芯片集成了带宽为20 Tbps的二维片上网络(NoC);692K的6输入查找表(LUT);40K Int8 MAC提供高于80 TOps的算力;OCuLink – 用于连接扩展卡的4通道PCIe Gen 4连接器。
VectorPath加速卡还包括一整套Achronix的ACE开发工具,以及BittWare的基板管理控制器和开发工具包,其中包括API、PCIe驱动程序、诊断自测和应用示例设计,以提供快速的、开箱即用的体验。专为原型设计和大批量生产应用而设计的VectorPath S7t-VG6加速卡使设计人员能够处理极大量的数据,这是前几代FPGA无法做到的。
值得一提的是,VectorPath中采用的Speedster7t FPGA系列芯片为高带宽数据加速应用提供了全新的性能和适应性。一个是其内置的人工智能/机器学习(AI / ML),大幅提升了人工智能应用的性能;另一个是它革命性的2D片上网络(NoC)技术,其带宽容量超过20 Tbps,可将数据从高速接口移动到FPGA逻辑架构,或跨越FPGA逻辑架构进行数据移动。该2D NoC通过在每个方向上为每个NoC行和列提供256位的单向总线和总计512 Gbps的带宽,从而缓解了数据瓶颈。NoC的主要接口是行业标准的AXI通道。在ACE 8.0设计软件中,现已提供对Speedster7t AC7t1500器件的初始软件支持。
VectorPath S7t-VG6加速卡将于2020年第二季度初开始供货。企业有多种方式可以买到VectorPath:一是可以通过BittWare采购VectorPath加速卡,另一个是可以通过其OEM供应商(如戴尔、HPE等)采购集成了VectorPath加速卡的服务器。另外,也可以直接采购BittWare的TeraBox FPGA Server,这是BittWare为VectorPath定制的服务器。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。