加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320 原创

作者：李祥敬

近日，Arm宣布推出Arm Ethos-U85神经网络处理器（NPU），以及全新物联网参考设计平台——Arm Corstone-320，以加速实现语音、音频和视觉系统的部署，促进未来多模态智能应用的全方位部署。

随着人工智能（AI）不断对我们的日常生活产生越来越大的影响，其推理任务也逐渐从云端迁移到边缘侧和端侧。

Arm物联网事业部业务拓展副总裁马健告诉记者，将计算资源部署于边缘和终端，在提升响应速度与可靠性、节省带宽资源、保护隐私与数据安全，以及降低成本等方面都具有明显优势。

Arm第三代面向边缘AI的NPU产品

物联网的兴起极大推动了边缘计算设备的普及，这些系统开始具备更强的处理能力和连接性，使得数据处理更加靠近数据源。随着机器学习（ML）和AI技术的发展，智能设备不仅能够执行任务，还能够学习和适应。

近来，伴随着Transformer与大模型的发展，AI模型的普适性、多模态支持，以及模型微调效率都有了质的突破，加上低功耗的AI加速器和专用芯片被集成到终端设备中，边缘智能正变得越来越自主和强大。

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320

Arm多年来不断开发边缘AI加速器，以满足边缘侧和端侧不断增长的推理工作负载需求。此前两款成功的NPU产品——Arm Ethos-U55和Ethos-U65，为边缘侧和端侧AI应用带来了高性能、高能效的解决方案。

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320

与上一代产品相比，Ethos-U85性能提升四倍，能效提高20%，同时，其MAC单元可从128个扩展到2048个（在1GHz时，算力实现4TOPs），能够为诸如工厂自动化和商用或智能家居摄像头等需要更高性能的应用提供有力的支持。

Ethos-U85提供了与前几代 Ethos U 系列相同的一致工具链，因此合作伙伴能够利用现有的投资，达到无缝的开发者体验。更重要的是，全新Ethos-U85 NPU支持了TensorFlow Lite和PyTorch等AI框架。

于2017年问世的Transformer架构彻底改变了生成式AI，并成为许多新型神经网络的首选架构。Transformer架构将推动新的应用，特别是面向视觉和生成式AI用例中，对于理解视频、填充图像的缺失部分或分析来自多个摄像头的数据以进行图像分类和目标检测等任务非常有效。

大模型在边缘AI落地面临模型成熟度、边缘AI平台开发等挑战，而Ethos-U85 可原生支持Transformer架构和卷积神经网络（CNN）以实现AI推理。

随着微处理器被部署到诸如工业机器视觉、可穿戴设备和消费者机器人等更多高性能的物联网系统中，Ethos-U85专为与Arm领先的Armv9 Cortex-A CPU相结合而设计，以加速处理ML任务，并为更广泛的更高性能设备提供高能效的边缘推理能力。

迄今，Arm Ethos NPU系列产品已有逾20家授权许可合作伙伴，其中，Alif Semiconductor和英飞凌是全新Arm Ethos-U85 NPU的早期采用者。

全新物联网参考设计平台

随着语音、音频和视觉功能融合到物联网（IoT）中，物联网设备与其周围环境交互、解读和感知的方式发生了彻底的变化。从前难以想象的广泛新应用和功能正逐步被发掘。而这将推动物联网设备和技术实现重大的创新与变革。

边缘AI既带来了机遇，也带来了挑战。在设计边缘AI芯片和系统时，需要在计算能力和能效之间找到合适的平衡。高性能的处理能力往往伴随着更高的功耗，而边缘设备往往对功耗和成本都有着严格限制。

马健表示，Arm架构天然具备优异的能效。在产品设计中实现低功耗设计是Arm与生俱来的DNA，能帮助广大的合作伙伴降低能耗和成本。

与此同时，随着越来越多的数据在边缘被处理，数据安全和隐私保护变得尤为重要。这要求芯片设计必须包含加密和安全功能。边缘用例五花八门，传统物联网市场存在碎片化，为了更好地统一多样化的应用要求，达到规模化效益，软件定义和适于软件移植的标准更是必不可少。Arm在IP、参考设计和软件标准上持续投入，从而帮助整个边缘AI生态应对这些挑战。

Arm一贯秉承构建通用计算平台和生态的策略，不仅平衡性能与能效，更将软件的可扩展性和系统应用的开发成本作为一个关键的考量因素，进而助力生态系统合作伙伴实现最低的总拥有成本（TCO）。

“我们认为只有普适性的通用计算平台才可能达到规模化，进而更好地实现丰富的软件支持。期待未来通过大模型和多模态，物联网碎片化问题可以得到更好的改进，AI会从一个单一功能到多功能，甚至是向通用 AI 的方向演进，这样的演进方式也非常适合搭载Arm推出的通用处理器，不管是嵌入式处理器还是应用处理器，还是处理器上实现的统一的工具链以及对操作系统（OS）和中间件的软件支持。”马健说。

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320

Arm Corstone-320物联网参考设计平台集成了Arm最高性能的Cortex-M CPU——Cortex-M85、Mali-C55 ISP和全新的Ethos-U85 NPU，为语音、音频和视觉等广泛的边缘AI应用提供所需的性能，例如实时图像分类和目标识别，或在智能音箱上启用具有自然语言翻译功能的语音助手。

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320

该参考设计平台涵盖了软件、工具和支持，其中包括Arm虚拟硬件。该平台的软硬件结合特性将使开发者能够在物理芯片就绪前便启动软件开发工作，从而加速推进产品进程，为日益复杂的边缘AI设备缩短上市时间。

马健表示，软硬件必须协同工作才能释放AI处理的最大潜能。Arm不仅仅聚焦处理器IP，更是在软件与工具链方面加强投资，以满足更简单、快速的高性能边缘AI系统的开发需求，支持诸多AI算子与应用在Arm计算平台上的优化运行，使边缘AI在Arm平台上“枝繁叶茂”。

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320

展望AI加速器的未来，AI正处于非常迅速的发展初期，尤其是边缘AI。Arm将持续通过强大的产品组合，对新的Transformer模型提供原生的支持，对工具链保持一致、易用的特性，帮助整个物联网生态更容易实现AI和ML的转型。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320 原创

来源：至顶网计算频道

2024

04/15

16:13

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

一颗192核的Arm服务器CPU

边缘AI时代已至，如何突破存储瓶颈？

从协同走向助手时代 英特尔引领边缘AI变革

Arm技术媒体分享日：探索AI时代的计算前沿与生态布局

引领AI时代计算新纪元：Arm终端计算子系统重塑智能设备性能边界

Arm亮相COMPUTEX 2024： 预计2025年底超过1000亿台Arm设备可用于AI

Arm推出人工智能优化的Arm终端计算子系统以及新的Arm Kleidi软件，重新定义移动端体验

《日经亚洲》报道Arm明年将推首款产品进军人工智能芯片市场

让智能手机与PC具备领先的AI计算性能 下一代Arm Cortex-X内核信息“浮出水面”

Arm的使命是助力应对AI 无止尽的能源需求

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

从协同走向助手时代英特尔引领边缘AI变革

Arm亮相COMPUTEX 2024：预计2025年底超过1000亿台Arm设备可用于AI

让智能手机与PC具备领先的AI计算性能下一代Arm Cortex-X内核信息“浮出水面”