Arm Ethos-U85：满足物联网面向AI时代的高性能需求

Arm多年来不断开发边缘AI加速器，以满足边缘侧和端侧不断增长的推理工作负载需求。此前两款成功的NPU产品——Arm Ethos-U55和Ethos-U65，为边缘侧和端侧AI应用带来了高性能、高能效的解决方案。

作者：Arm 物联网事业部行业市场营销高级总监 Parag Beerkaka

随着人工智能 (AI) 不断对我们的日常生活产生越来越大的影响，其推理任务也逐渐从云端迁移到边缘侧和端侧。边缘侧推理为板载设备引入智能化能力，使数据能够在本地进行处理，并实时做出决策，同时提高了数据隐私性和安全性。

Arm Ethos NPU

Arm 多年来不断开发边缘 AI 加速器，以满足边缘侧和端侧不断增长的推理工作负载需求。此前两款成功的 NPU 产品——Arm® Ethos™-U55 和 Ethos-U65，为边缘侧和端侧 AI 应用带来了高性能、高能效的解决方案。

Ethos-U55 通常部署在基于 Cortex®-M 的异构系统中。而 Ethos-U65 则将 Ethos-U 系列的适用性扩展到基于 Cortex-A 的系统中，并为设备上的机器学习 (ML) 能力带来了两倍的性能提升。这两款产品均提供统一的工具链，可简化开发并支持常见的 ML 神经网络运算，包括卷积神经网络 (CNN) 和循环神经网络 (RNN)。

Transformer 架构的影响

于 2017 年问世的Transformer 架构彻底改变了生成式 AI，并成为许多新型神经网络的首选架构。基于 Transformer 架构的模型可利用注意力机制处理序列数据，并在机器翻译、自然语言理解、语音识别、分割和图像字幕生成等多项 AI 任务中实现优异的效果。

这些模型可被调整和压缩，在不过多影响准确度的情况下，能高效运行于边缘设备上，并在许多边缘侧和端侧用例中发挥领先的优势。

全新 Ethos-U85 NPU

依托 Ethos-U 系列 NPU 过往的成功经验，Arm 推出了全新产品—— Ethos-U85。该处理器秉承此前 Ethos-U NPU 一贯的高性能、高能效设计理念，并可同时为边缘侧和端侧设备上采用 Transformer 架构的现有和未来的工作负载提供支持。

Ethos-U85 是 Arm Ethos-U 产品线中的第三代 NPU，也是迄今为止性能和能效最强的 Ethos NPU。与上一代产品相比，该 NPU 的性能提升了四倍，能效提高了 20%，并且可在主流网络上实现高达 85% 的利用率。全新 Ethos-U85 可满足诸如工厂自动化和商用或智能家居摄像头等物联网应用不断攀升的性能需求。此外，其专为搭配基于 Cortex-M 或 Cortex-A的系统一同运行而设计，并容忍高 DRAM 延迟。

Ethos-U85 的主要特性包括：

单周期支持从 128 到 2048 个 MAC单元的配置——在 1GHz 时，算力可支持从 256 GOPS 到 4 TOPS。
支持 int8 权重和 int8 或 int16 激活。
支持 Transformer 架构网络，以及 CNN 和 RNN。
硬件原生支持 2/4 稀疏性，使吞吐量翻倍。
内部 SRAM 为 29 至 267 KB，多达六个 128 位 AXI5 接口。
支持权重压缩，采用标准和快速权重编码器。
支持扩展压缩。

除了 Ethos-U55 和 Ethos-U65 目前支持的算子，通过支持 TRANSPOSE、GATHER、MATMUL、RESIZE BILINEAR 和 ARGMAX 等运算，Ethos-U85 涵盖了对 Transformer 模型和 DeeplabV3 语义分割网络的原生硬件支持。

Ethos-U85 也支持元素级算子链化。通过链化将元素级运算与先前的运算相结合，使 SRAM 不必先写入再读取中间张量。由此可凭借 NPU 和内存之间数据传输量的减少，提高 NPU 的效率。相比于 Ethos-U65，链化是 Ethos-U85 在效率提升上的新功能之一，其余还包括快速的权重编码器、优化的 MAC 阵列能效，以及提升的元素效率。

Arm Ethos-U85：满足物联网面向AI时代的高性能需求

Ethos-U85 可用于与 Ethos-U55 和 Ethos-U65 相同的系统配置流程，并且我们支持从基于 Cortex-A 的系统直接驱动 Ethos-U85 的功能。

Ethos-U85 支持与上一代Ethos-U系列产品相同的软件工具链, 即使用TFLmicro运行时。此外，在这个基础上，Ethos-U85 同时还能为更广泛采用 Transformer 架构的用例提供支持，这对于已经投入在基于 Cortex-A/Cortex-M 与 Ethos-U55/Ethos-U65 的系统厂商来说，将能扩大其过往的投资价值。未来，我们预计将支持面向边缘设备的 PyTorch 运行时 ExecuTorch。

Ethos-U85 支持的算子将在 NPU 上进行加速，对于特殊算子不支持的情况，其中部分算子将调用CMSIS-NN库实现在Cortex-M系统上进行加速。例如，在 tinyLlama 的用例中，该模型算子可完全映射到 Ethos-U85，没有算子回退到 CPU。

Ethos-U85 担任了 Arm 全新物联网参考设计平台 Corstone-320 的核心角色，该参考设计平台加快了各类 AIoT 解决方案中高性能 SoC 的开发和部署。

释放边缘AI 的无限潜力

Ethos-U85 将提供在边缘侧和端侧设备上执行领先 AI 功能所需的算力。随着 AI 时代的不断发展，我们的合作伙伴将获得基于 Arm Ethos-U 的可靠、高效兼具高性能的解决方案。我们预计在新兴的边缘 AI 用例、智能家居、零售或工业场景中看到Ethos-U85 被广泛部署，这些用例和场景需要更高的计算性能，并支持新型的 AI 框架。

Arm 引以为傲的是，我们不断通过前沿的软硬件解决方案，为合作伙伴与生态系统提供强而有力的支持。全新 Ethos-U85 的推出将释放边缘侧和端侧 AI 推理用例的无限潜能，从而改变世界。Arm 正在引领边缘 AI 的创新提升至全新水平，并持续夯实 Arm 成为未来边缘 AI 的基石。

来源：业界供稿

0赞

好文章，需要你的鼓励

Arm Ethos-U85：满足物联网面向AI时代的高性能需求

来源：业界供稿

2024

04/09

14:36

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

一颗192核的Arm服务器CPU

Arm技术媒体分享日：探索AI时代的计算前沿与生态布局

引领AI时代计算新纪元：Arm终端计算子系统重塑智能设备性能边界

Arm亮相COMPUTEX 2024： 预计2025年底超过1000亿台Arm设备可用于AI

Arm推出人工智能优化的Arm终端计算子系统以及新的Arm Kleidi软件，重新定义移动端体验

《日经亚洲》报道Arm明年将推首款产品进军人工智能芯片市场

让智能手机与PC具备领先的AI计算性能 下一代Arm Cortex-X内核信息“浮出水面”

Arm的使命是助力应对AI 无止尽的能源需求

能效和定制化将推动ARM在人工智能领域发挥关键作用

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Arm亮相COMPUTEX 2024：预计2025年底超过1000亿台Arm设备可用于AI

让智能手机与PC具备领先的AI计算性能下一代Arm Cortex-X内核信息“浮出水面”