至顶网服务器频道 10月23日 新闻消息(文/邹大斌): 10月16日,赛灵思在其举办的开发者大会上对外发布了两个新的产品:功能强大的加速器卡Alveo和业界首款自适应计算加速平台 (Adaptive Compute Acceleration Platform ,ACAP) Versal。Alveo可以用来大幅提升云端和本地数据中心中服务器的性能;Versal实现软硬件可编程,赛灵思称其将开启一个快速创新的新时代。赛灵思总裁及CEO Victor Peng亲临北京大会现场,这是Victor Peng时隔半年后再度来到中国,今年3月份刚刚就任赛灵思CEO不久的Victor Peng曾来华和中国媒体就ACAP和赛灵思的最新战略进行过交流。本次新发布的2款产品都瞄准了AI推理,显然赛灵思非常看好中国市场旺盛的AI需求。
赛灵思总裁及CEO Victor Peng
席卷全球的AI热带火了AI相关的芯片产业,无论GPU还是FPGA都迎来了最好的发展时机。作为FPGA的发明者,赛灵思的业务也随着AI的兴起而进入快速成长状态,同时其创新速度也不断加快,Versal ACAP就是集赛灵思多项创新技术之大成者,将开启一个新的时代。
ACAP的推出是赛灵思认为今天芯片的更新周期远远落后于实际需求。众所周知,诞生于上个世纪60年代的摩尔定律在今天遇到了前所未有的挑战,靠提升芯片频率以及集成更多晶体管来提升性能的难度越来越大,这就使得人们开始引入异构计算来满足AI等高计算密度的需求,GPU、FPGA这几年市场行业也不断看涨。不过,赛灵思还希望在异构计算上还能往前走一步,推出一种超越FPGA的新计算平台,这就是Versal ACAP。
“随着 AI 和大数据的爆炸性发展以及摩尔定律的放缓,芯片设计的周期已经无法跟上创新的脚步。Versal 历经 4 年的研发,我们对其进行了独特设计,支持所有类型的开发者通过优化的软硬件来为他们的整体应用提速,同时具备即时的灵活应变能力,从而能够跟上科技快速发展的步伐。” 赛灵思总裁及CEO Victor Peng在演讲中表示。
据悉,Versal ACAP 整合标量处理引擎、自适应硬件引擎和智能引擎以及前沿的存储器和接口技术,能为所有的应用提供强大的异构加速功能。Versal 产品组合基于台积电(TSMC)的 7 nm FinFET工艺技术,可将软件可编程性与特定领域硬件加速和灵活应变能力相结合的平台。该产品组合包括6个系列的器件,其独特架构针对云端、网络、无线通信乃至边缘计算和端点等不同市场的众多应用提供了可扩展性和 AI 推断功能。
Victor Peng表示,对 Versal ACAP而言,其最大的创新在于其硬件和软件均可由软件开发者、数据科学家和硬件开发者进行编程和优化,这要归功于其符合业界标准设计流程的一系列工具、软件、库、IP、中间件和框架。
今年3月Victor Peng来华的时候曾对外发布赛灵思公司新的战略,即数据中心优先、加速核心市场发展以及驱动灵活应变的计算。如果说ACAP的推出是对“驱动灵活应变的计算”这一战略的落地,那么加速器卡Alveo可以看做是赛灵思数据中心优先战略的落地。
Alveo是一款FPGA的加速卡,它让用户在运行实时机器学习推断以及视频处理、基因组学、数据分析等关键的数据中心应用时,能以较低时延实现突破性的性能提升。目前,Alveo U200 和 Alveo U250 由 Xilinx UltraScale+ FPGA 提供强劲动力,现已开始接受量产订单。
Alveo 加速器卡针对各种类型的应用提供显著的性能优势。就机器学习而言,Alveo U250实时推断吞吐量比高端 CPU高出20 倍,相对于高端 GPU 等固定功能的加速器,能让 2 毫秒以下的低时延应用性能提升 4 倍以上。此外,Alveo 加速器卡相对于 GPU 能将时延减少 3 倍,在运行实时推断应用时提供显著的性能优势。数据库搜索等一些应用可从根本上得到加速,性能比 CPU 高90 倍以上。
据悉,随着AI应用的兴起,赛灵思的FPGA已经落户很多数据中心,以加速AI应用,同时降低客户计算成本。另外,不少云服务商也已经与赛灵思合作提供FaaS(FPGA as a Service)服务,包括AWS、阿里云、华为云都有这一业务。Alveo的推出无疑将加速赛灵思在数据中心落地的速度。
除了芯片级产品,赛灵思还在生态建设上面发力,包括加速各种开发工具、软件库的优化与丰富。Victor Peng表示,芯片非常重要的,是基础,但是芯片仅仅是平台的一部分,还有软件堆栈。赛灵思现在还在开发集成度很高的开发工具、优化的库,还有运行环境的各种软件以及相关框架标准等。
“我们希望我们的产品能够帮助用户和开发者来加速AI应用,特别是加速AI和机器学习的推断进程,最终帮助全球更迅速地拥抱更光明的未来,比如利用AI改善人们的生活质量、提升城市的安全、让汽车更加智慧等。” Victor Peng说。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。