这套平台搭载具备4-bit与8-bit整数数学运算能力的新型AI引擎,同时采用新的内存架构。
赛灵思公司之前刚刚推出了高灵活度Versal ACAP(自适应计算加速平台)系列的第一套边缘模型,这也是他们继AI、Prime与Premium模型之后发布的又一新模型。Versal最初亮相于三年之前,强调将灵活的可重构逻辑与硬编码引擎,同ARM CPU内核相合起来。理论上,ACAP相较于传统FPGA拥有更高的性能、灵活性、更低功耗,并能为开发人员提供易于使用的编程功能。赛灵思方面还宣称,AI Edge能够以75瓦功耗在8-bit整数运算中提供228 TOPS性能。
Versal ACAP不仅对赛灵思来说意义重大,在AMD眼中也极为重要。目前边缘AI市场正呈现出全面爆发的态势,Gartner公司预计2025年全球芯片组收入将达到约500亿美元。考虑到自身在这一领域的市场份额还比较有限,AMD公司决定借Versal的机会加入战团。另外,ACAP这一概念也非常有趣,其强调加快逻辑执行速度、增强逻辑的可重新配置能力,帮助用户针对特定应用程序及模型获得定制化加速器。大家可以把ACAP理解成带有定制化FPGA门的SoC。截至目前,Versal在市场上的吸引力似乎还没有充分显现,但这也是正常现象——毕竟任何一场惊天动地的变革都需要酝酿期。

Omdia与Gartner发布的数据,可以看到边缘应用的发展潜力十分巨大。
赛灵思想干什么?
在最初于2018年公布ACAP战略时,赛灵思公司制定了一份发展路线图,其中包含六大不同设计点:AI Edge、AI Core、AI RF、Prime、Premium以及HBM系列。在我们看来,其中Edge拥有的发展空间最大,因此赛灵思与AMD必须要拿出真正能够满足需求且拥有长久生命力的解决方案。也许这套新的AI边缘平台就是理想答案,一切将在2022年见分晓。

赛灵思宣称,Versal AI Edge平台能够将GPU的效率提高4倍,并将计算密度相较于早期赛灵思FPGA提高整整一个数量级。
赛灵思还升级了AI引擎以提升在边缘场景下的推理速度,通过降低运算精度(4-bit与8-bit)提高性能,并添加了新的内存架构以承载规模更大的模型。其中计算密度的优化尤其出色,可达赛灵思原有FPGA的10倍。虽然直到2022年才能推出似乎有些令人失望,但这类平台产品确实拥有多年的设计周期,因此早点向客户发布即将推出的产品确实符合赛灵思自身以及客户的最大利益。
赛灵思还通过幻灯片展示了他们设想中开发人员在Versal AI Edge上部署完整应用程序的场景。下图所示为自动驾驶汽车布局,可以看到其中的感知(ARM)、环境表征与传感器融合(Adaptable Engines)、图像调节(DSP)与对象分类(AI引擎)等工作流元素能够在ACAP上的不同位置同步运行。赛灵思公司还分享了工厂自动化、协作机器人以及无人机等用例中的类似设计,这表明复杂的工作流程并不一定需要引入其他芯片。如同一把瑞士军刀,ACAP自己就能提供大家需要的每一种特定领域架构(DSA)。

赛灵思展示了AI Edge平台如何支持各种计算任务,包括自动驾驶汽车。
说到DSA,赛灵思还专门强调了其超越静态优化引擎的卓越能力,这种新功能被命名为动态功能交换(Dynamic Function Exchange),其中ACAP的FPGA部分能够在几毫秒内即时重新配置以完成不同类型的工作。想象一下,这项功能有望在车辆中重新配置设备以实现车道管理中的驾驶模式、停车辅助中的低速模式以及安全保障中的驾驶后模式。随着开发人员逐步部署这项功能,相信它会给赛灵思及AMD带来独特且高度差异化的竞争优势,并在功耗、性能与尺寸方面全面压制住常规芯片平台。
AI Edge的开发工具将于2021年下半年发布,明年年初推出首批芯片,评估套件与正式量产则计划于2022年下半年启动。
总结
从公告内容来看,Versal ACAP系列的全面成型与正式交付还需要很长时间。但要想充分利用其中的独特功能,感兴趣的朋友最好从现在开始就做好准备,确保在2023年最终产品全面就绪时立刻上手使用。虽然这并不是我们见过的最快、或者最节能的平台,但Versal Ai Edge系列确实带来了强大的灵活性与定制潜力。总之,让我们共同期待!
好文章,需要你的鼓励
大多数用户只使用计算机预装的操作系统直到报废,很少尝试更换系统。即使使用较老版本的Windows或macOS,用户仍可通过开源软件获益。本文建议通过重新安装系统来提升性能,Mac用户可从苹果官方下载各版本系统安装包,PC用户则建议使用纯净版Windows 10 LTSC以获得更长支持周期。文章强调备份数据的重要性,并推荐升级内存和固态硬盘。对于老旧系统,应替换需要联网的内置应用以降低安全风险,定期进行系统维护清理。
新加坡南洋理工大学研究团队提出"棱镜假设",认为图像可像光谱一样分解为不同频率成分,低频承载语义信息,高频包含视觉细节。基于此开发的统一自编码系统UAE,通过频率域分解成功统一了图像理解和生成能力,在多项基准测试中超越现有方法,为构建真正统一的视觉AI系统提供了新思路,有望推动计算机视觉技术向更智能统一的方向发展。
微软杰出工程师Galen Hunt在LinkedIn上宣布,目标是到2030年消除微软所有C和C++代码。公司正结合AI和算法重写最大的代码库,目标是"1名工程师、1个月、100万行代码"。微软已构建强大的代码处理基础设施,利用AI代理和算法指导进行大规模代码修改。该项目旨在将微软最大的C和C++系统翻译为内存安全的Rust语言,以提高软件安全性并消除技术债务。
芝加哥伊利诺伊大学团队提出QuCo-RAG技术,通过检查AI训练数据统计信息而非内部信号来检测AI回答可靠性。该方法采用两阶段验证:预检查问题实体频率,运行时验证事实关联。实验显示准确率提升5-14个百分点,在多个模型上表现稳定,为AI可靠性检测提供了客观可验证的新方案。