新闻重点:
Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)今日宣布推出 Arm® Ethos™-U85 神经网络处理器 (NPU),是 Arm 迄今性能最高且能效最佳的 Ethos NPU 产品,以及全新物联网参考设计平台——Arm Corstone™-320,以加速实现语音、音频和视觉系统的部署。
Arm 高级副总裁兼物联网事业部总经理 Paul Williamson 表示:“随着边缘人工智能 (AI) 的部署规模持续扩大,芯片创新者必须应对日趋复杂的系统和软件、不断激增的 AI 性能需求,以及加速产品上市进程的压力。与此同时,软件开发者需要更加一致、简化的开发体验,并能更轻松地与新型的 AI 框架和库实现集成。此次 Arm 推出的新技术满足了加速边缘 AI 部署不断增长的要求。从初创企业到全球最大的微控制器厂商,每家企业都将 Arm 技术视作首选平台,以构建其从云端到边缘侧的 AI 解决方案。”
Arm Ethos-U85 NPU:Arm 全新第三代面向边缘 AI 的NPU 产品
与上一代产品相比,Ethos-U85 性能提升四倍,能效提高 20%,同时,其 MAC 单元可从 128 个扩展到 2048 个(在 1GHz 时,算力实现 4 TOPs),能够为诸如工厂自动化和商用或智能家居摄像头等需要更高性能的应用提供有力的支持。Ethos-U85 提供了相同的一致工具链,因此合作伙伴能够利用现有的投资,达到无缝的开发者体验。更重要的是,全新 Ethos-U85 NPU 支持了 TensorFlow Lite 和 PyTorch 等 AI 框架。
Ethos-U85 支持 Transformer 架构和卷积神经网络 (CNN) 以实现 AI 推理。Transformer 架构将推动新的应用,特别是面向视觉和生成式 AI 用例中,对于理解视频、填充图像的缺失部分或分析来自多个摄像头的数据以进行图像分类和目标检测等任务非常有效。
随着微处理器被部署到诸如工业机器视觉、可穿戴设备和消费者机器人等更多高性能的物联网系统中,Ethos-U85 专为与 Arm 领先的 Armv9 Cortex®-A CPU 相结合而设计,以加速处理机器学习 (ML) 任务,并为更广泛的更高性能设备提供高能效的边缘推理能力。
迄今,Arm Ethos NPU 系列产品已有逾 20 家授权许可合作伙伴,其中,Alif Semiconductor 和英飞凌是全新 Arm Ethos-U85 NPU 的早期采用者。
Alif Semiconductor 联合创始人兼总裁 Reza Kazerounian 表示:“新一代边缘 AI 应用的 ML 工作负载需要以节能的方式提供高性能表现。Alif 是业界首家推出基于 Arm Cortex-M55 和 Ethos-U55 的边缘 AI 解决方案的企业,我们非常高兴并期待 Arm 再次推出全新的 AI 技术,Ethos-U85 NPU,它将为我们新一代 Ensemble 系列微控制器和融合处理器带来所需的计算性能,助力实现未来边缘 AI 和视觉用例。”
英飞凌工业 MCU、物联网、无线和计算业务高级副总裁 Steve Tateosian 表示:“边缘 AI 用例日趋复杂,想要把握 AI 时代的机遇离不开安全、高性能的计算系统。我们期待在与 Arm 长期的合作伙伴关系基础上,通过 Arm Ethos-U85 及其对边缘 AI 部署所提供的 Transformer 架构支持,进而让这些复杂的系统成为可能。”
Corstone-320:全新物联网参考设计平台,加速语音、音频和视觉系统的部署
Arm Corstone-320 物联网参考设计平台集成了 Arm 最高性能的 Cortex-M CPU——Cortex-M85、Mali™-C55 ISP和全新的 Ethos-U85 NPU,为语音、音频和视觉等广泛的边缘 AI 应用提供所需的性能,例如实时图像分类和目标识别,或在智能音箱上启用具有自然语言翻译功能的语音助手。该参考设计平台涵盖了软件、工具和支持,其中包括 Arm 虚拟硬件。该平台的软硬件结合特性将使开发者能够在物理芯片就绪前便启动软件开发工作,从而加速推进产品进程,为日益复杂的边缘 AI 设备缩短上市时间。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。