Arm® 今日宣布多项全新的战略合作,继续致力于推动人工智能 (AI) 的创新,并将 AI 的体验变为现实。除了自身已能实现 AI 开发的技术平台之外,Arm 还与 AMD、英特尔、Meta、微软、NVIDIA 和高通技术公司等领先的科技企业携手合作,通过多项计划,聚焦于先进 AI 能力的实现,由此带来更快响应、更加安全的用户体验。这些合作计划将在所有计算进行之处,助力 1500 多万名 Arm 开发者,构建其所需的基础框架、技术和规范,带来新一代的 AI 体验。
Arm 执行副总裁兼首席架构师与院士 Richard Grisenthwaite 表示:“AI 的广泛应用依赖于软、硬件创新的持续协同。小到边缘侧运行工作负载的小型传感器,大到处理复杂工作负载以训练大语言模型 (LLM) 的大型服务器,软硬件的协同发展将在每个技术节点中,助力 AI 能力的提升。随着整个生态系统不断发掘 AI 的真正潜力,我们也将面临安全性、可持续性和数据瓶颈等诸多挑战。因此,继续探索行业内的协作至关重要,为此,我们才能实现 AI 的规模化,包括加大边缘侧的推理能力。”
助力边缘 AI 发展
当下生成式 AI 和 LLM 正成为人们关注的焦点,而鉴于在智能手机领域,70% 的第三方 AI 应用都运行在 Arm CPU 上,Arm 已引领边缘 AI 长达多年。在探索如何以可持续的方式实现 AI 并高效传输数据的同时,行业也需要继续发展以实现在边缘侧运行 AI 和机器学习 (ML) 模型,然而,开发者在此却面临着计算资源日益受限的难题,使这个任务的实现充满了挑战。
Arm 正与 NVIDIA 展开合作,针对 NVIDIA TAO 进行适配。这是一套针对 Arm Ethos™-U NPU 使用的低代码开源 AI 工具包,有助于构建性能优化的视觉 AI 模型,并将其部署于搭载 Ethos-U 的处理器上。NVIDIA TAO 提供了一个易使用的界面,可在免费且开源的领先 AI 和 ML 框架——TensorFlow 和 PyTorch 上进行构建工作,为开发者带来轻松无缝的模型开发和部署环境,同时赋能边缘设备实现更复杂的 AI 工作负载,提升 AI 体验。
在所有设备与市场中推动神经网络的应用
在边缘侧推进神经网络的部署是实现 AI 可持续增长的重要一环。Arm 携手 Meta,通过 ExecuTorch,将 PyTorch 引入基于 Arm 架构的边缘侧移动和嵌入式平台。ExecuTorch 可助力开发者更轻松地在移动和边缘设备上,部署先进的 AI 和 ML 工作负载所需的先进神经网络。Arm 与 Meta 的合作将确保通过 PyTorch 和 ExecuTorch,开发者能在未来更轻松地开发和部署 AI 与 ML 模型。
与 Meta 的合作依托于 Arm 在 Tensor 运算符集架构 (TOSA) 方面的巨大投入,TOSA 为 AI 和 ML 加速器提供了通用框架,并支持广泛的深度神经网络工作负载。在基于 Arm 架构的各种处理器和数十亿的设备上,TOSA 也将成为 AI 和 ML 的坚实基石。
推动产业规模化的 AI
若要以相对低的成本实现 AI 规模化落地,支持广泛的数据格式至关重要。Arm 一直在为诸多专注于 AI 工作负载的新型小数据类型提供支持。
去年,Arm、英特尔和 NVIDIA 联合发布了新型 8 位浮点规范,即“FP8”。自此 FP8 格式发展迅猛,参与合作的企业已扩大至 AMD、Arm、谷歌、英特尔、Meta 和 NVIDIA,并共同制定了正式的 OCP 8 位浮点规范 (OFP8)。在最新的 A-profile 架构更新中,Arm 添加了与该标准一致的 OFP8,以助力其在行业内神经网络中的快速普及。OFP8 是交换 8 位数据格式,使软件生态系统能够轻松共享神经网络模型,从而不断提高数十亿设备上的 AI 计算能力。
开放的标准对于推动 AI 生态系统的创新、一致性与互操作性至关重要。为继续支持相关标准的行业协作,Arm 于近日正式加入了 MX 联盟,该联盟旗下成员包括了 AMD、Arm、英特尔、Meta、微软、 NVIDIA 和高通技术公司。近期,MX 联盟针对名为微扩展的新技术,进行技术规范的合作。这项技术基于芯片设计领域多年的探索与研究,是一种用于 AI 应用的窄位(8 位和 8 位以下)训练与推理的精细扩展方法。该规范对窄位数据格式进行了标准化,以消除行业的碎片化,实现 AI 的规模化。
秉承合作精神,MX 联盟通过开放计算项目 OCP,以开放、免许可的形式发布了 MX 规范。OCP 项目由超大规模数据中心运营商和计算基础设施领域的其他行业参与者组成,旨在促进相关技术在业内的广泛采用。这也体现了各方认识到在生态系统中对可扩展 AI 解决方案提供公平访问的必要需求。
前所未有的 AI 创新
Arm 已成为全球 AI 部署的基础。Arm 致力于为开发者提供构建先进、复杂的 AI 工作负载所需的技术,而上述的种种合作只是Arm 众多举措中的一部分。从传感器、智能手机和软件定义汽车,到服务器和超级计算机,Arm 将成为未来 AI 发展的基石。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。