这套平台搭载具备4-bit与8-bit整数数学运算能力的新型AI引擎,同时采用新的内存架构。
赛灵思公司之前刚刚推出了高灵活度Versal ACAP(自适应计算加速平台)系列的第一套边缘模型,这也是他们继AI、Prime与Premium模型之后发布的又一新模型。Versal最初亮相于三年之前,强调将灵活的可重构逻辑与硬编码引擎,同ARM CPU内核相合起来。理论上,ACAP相较于传统FPGA拥有更高的性能、灵活性、更低功耗,并能为开发人员提供易于使用的编程功能。赛灵思方面还宣称,AI Edge能够以75瓦功耗在8-bit整数运算中提供228 TOPS性能。
Versal ACAP不仅对赛灵思来说意义重大,在AMD眼中也极为重要。目前边缘AI市场正呈现出全面爆发的态势,Gartner公司预计2025年全球芯片组收入将达到约500亿美元。考虑到自身在这一领域的市场份额还比较有限,AMD公司决定借Versal的机会加入战团。另外,ACAP这一概念也非常有趣,其强调加快逻辑执行速度、增强逻辑的可重新配置能力,帮助用户针对特定应用程序及模型获得定制化加速器。大家可以把ACAP理解成带有定制化FPGA门的SoC。截至目前,Versal在市场上的吸引力似乎还没有充分显现,但这也是正常现象——毕竟任何一场惊天动地的变革都需要酝酿期。
Omdia与Gartner发布的数据,可以看到边缘应用的发展潜力十分巨大。
赛灵思想干什么?
在最初于2018年公布ACAP战略时,赛灵思公司制定了一份发展路线图,其中包含六大不同设计点:AI Edge、AI Core、AI RF、Prime、Premium以及HBM系列。在我们看来,其中Edge拥有的发展空间最大,因此赛灵思与AMD必须要拿出真正能够满足需求且拥有长久生命力的解决方案。也许这套新的AI边缘平台就是理想答案,一切将在2022年见分晓。
赛灵思宣称,Versal AI Edge平台能够将GPU的效率提高4倍,并将计算密度相较于早期赛灵思FPGA提高整整一个数量级。
赛灵思还升级了AI引擎以提升在边缘场景下的推理速度,通过降低运算精度(4-bit与8-bit)提高性能,并添加了新的内存架构以承载规模更大的模型。其中计算密度的优化尤其出色,可达赛灵思原有FPGA的10倍。虽然直到2022年才能推出似乎有些令人失望,但这类平台产品确实拥有多年的设计周期,因此早点向客户发布即将推出的产品确实符合赛灵思自身以及客户的最大利益。
赛灵思还通过幻灯片展示了他们设想中开发人员在Versal AI Edge上部署完整应用程序的场景。下图所示为自动驾驶汽车布局,可以看到其中的感知(ARM)、环境表征与传感器融合(Adaptable Engines)、图像调节(DSP)与对象分类(AI引擎)等工作流元素能够在ACAP上的不同位置同步运行。赛灵思公司还分享了工厂自动化、协作机器人以及无人机等用例中的类似设计,这表明复杂的工作流程并不一定需要引入其他芯片。如同一把瑞士军刀,ACAP自己就能提供大家需要的每一种特定领域架构(DSA)。
赛灵思展示了AI Edge平台如何支持各种计算任务,包括自动驾驶汽车。
说到DSA,赛灵思还专门强调了其超越静态优化引擎的卓越能力,这种新功能被命名为动态功能交换(Dynamic Function Exchange),其中ACAP的FPGA部分能够在几毫秒内即时重新配置以完成不同类型的工作。想象一下,这项功能有望在车辆中重新配置设备以实现车道管理中的驾驶模式、停车辅助中的低速模式以及安全保障中的驾驶后模式。随着开发人员逐步部署这项功能,相信它会给赛灵思及AMD带来独特且高度差异化的竞争优势,并在功耗、性能与尺寸方面全面压制住常规芯片平台。
AI Edge的开发工具将于2021年下半年发布,明年年初推出首批芯片,评估套件与正式量产则计划于2022年下半年启动。
总结
从公告内容来看,Versal ACAP系列的全面成型与正式交付还需要很长时间。但要想充分利用其中的独特功能,感兴趣的朋友最好从现在开始就做好准备,确保在2023年最终产品全面就绪时立刻上手使用。虽然这并不是我们见过的最快、或者最节能的平台,但Versal Ai Edge系列确实带来了强大的灵活性与定制潜力。总之,让我们共同期待!
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。