这套平台搭载具备4-bit与8-bit整数数学运算能力的新型AI引擎,同时采用新的内存架构。
赛灵思公司之前刚刚推出了高灵活度Versal ACAP(自适应计算加速平台)系列的第一套边缘模型,这也是他们继AI、Prime与Premium模型之后发布的又一新模型。Versal最初亮相于三年之前,强调将灵活的可重构逻辑与硬编码引擎,同ARM CPU内核相合起来。理论上,ACAP相较于传统FPGA拥有更高的性能、灵活性、更低功耗,并能为开发人员提供易于使用的编程功能。赛灵思方面还宣称,AI Edge能够以75瓦功耗在8-bit整数运算中提供228 TOPS性能。
Versal ACAP不仅对赛灵思来说意义重大,在AMD眼中也极为重要。目前边缘AI市场正呈现出全面爆发的态势,Gartner公司预计2025年全球芯片组收入将达到约500亿美元。考虑到自身在这一领域的市场份额还比较有限,AMD公司决定借Versal的机会加入战团。另外,ACAP这一概念也非常有趣,其强调加快逻辑执行速度、增强逻辑的可重新配置能力,帮助用户针对特定应用程序及模型获得定制化加速器。大家可以把ACAP理解成带有定制化FPGA门的SoC。截至目前,Versal在市场上的吸引力似乎还没有充分显现,但这也是正常现象——毕竟任何一场惊天动地的变革都需要酝酿期。

Omdia与Gartner发布的数据,可以看到边缘应用的发展潜力十分巨大。
赛灵思想干什么?
在最初于2018年公布ACAP战略时,赛灵思公司制定了一份发展路线图,其中包含六大不同设计点:AI Edge、AI Core、AI RF、Prime、Premium以及HBM系列。在我们看来,其中Edge拥有的发展空间最大,因此赛灵思与AMD必须要拿出真正能够满足需求且拥有长久生命力的解决方案。也许这套新的AI边缘平台就是理想答案,一切将在2022年见分晓。

赛灵思宣称,Versal AI Edge平台能够将GPU的效率提高4倍,并将计算密度相较于早期赛灵思FPGA提高整整一个数量级。
赛灵思还升级了AI引擎以提升在边缘场景下的推理速度,通过降低运算精度(4-bit与8-bit)提高性能,并添加了新的内存架构以承载规模更大的模型。其中计算密度的优化尤其出色,可达赛灵思原有FPGA的10倍。虽然直到2022年才能推出似乎有些令人失望,但这类平台产品确实拥有多年的设计周期,因此早点向客户发布即将推出的产品确实符合赛灵思自身以及客户的最大利益。
赛灵思还通过幻灯片展示了他们设想中开发人员在Versal AI Edge上部署完整应用程序的场景。下图所示为自动驾驶汽车布局,可以看到其中的感知(ARM)、环境表征与传感器融合(Adaptable Engines)、图像调节(DSP)与对象分类(AI引擎)等工作流元素能够在ACAP上的不同位置同步运行。赛灵思公司还分享了工厂自动化、协作机器人以及无人机等用例中的类似设计,这表明复杂的工作流程并不一定需要引入其他芯片。如同一把瑞士军刀,ACAP自己就能提供大家需要的每一种特定领域架构(DSA)。

赛灵思展示了AI Edge平台如何支持各种计算任务,包括自动驾驶汽车。
说到DSA,赛灵思还专门强调了其超越静态优化引擎的卓越能力,这种新功能被命名为动态功能交换(Dynamic Function Exchange),其中ACAP的FPGA部分能够在几毫秒内即时重新配置以完成不同类型的工作。想象一下,这项功能有望在车辆中重新配置设备以实现车道管理中的驾驶模式、停车辅助中的低速模式以及安全保障中的驾驶后模式。随着开发人员逐步部署这项功能,相信它会给赛灵思及AMD带来独特且高度差异化的竞争优势,并在功耗、性能与尺寸方面全面压制住常规芯片平台。
AI Edge的开发工具将于2021年下半年发布,明年年初推出首批芯片,评估套件与正式量产则计划于2022年下半年启动。
总结
从公告内容来看,Versal ACAP系列的全面成型与正式交付还需要很长时间。但要想充分利用其中的独特功能,感兴趣的朋友最好从现在开始就做好准备,确保在2023年最终产品全面就绪时立刻上手使用。虽然这并不是我们见过的最快、或者最节能的平台,但Versal Ai Edge系列确实带来了强大的灵活性与定制潜力。总之,让我们共同期待!
好文章,需要你的鼓励
浙江大学研究团队开发了ContextGen,这是首个能够同时精确控制多个对象位置和外观的AI图像生成系统。该系统通过情境布局锚定和身份一致性注意力两大创新机制,解决了传统AI在多对象场景中位置控制不准确和身份保持困难的问题,并创建了业界首个10万样本的专业训练数据集,在多项测试中超越现有技术。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
上海交通大学研究团队开发的SR-Scientist系统实现了人工智能在科学发现领域的重大突破。该系统能够像真正的科学家一样,从实验数据中自主发现数学公式,通过工具驱动的数据分析和长期优化机制,在四个科学领域的测试中比现有方法提高了6%-35%的精确度。这标志着AI从被动工具转变为主动科学发现者的重要里程碑。