Arm® 今日宣布多项全新的战略合作,继续致力于推动人工智能 (AI) 的创新,并将 AI 的体验变为现实。除了自身已能实现 AI 开发的技术平台之外,Arm 还与 AMD、英特尔、Meta、微软、NVIDIA 和高通技术公司等领先的科技企业携手合作,通过多项计划,聚焦于先进 AI 能力的实现,由此带来更快响应、更加安全的用户体验。这些合作计划将在所有计算进行之处,助力 1500 多万名 Arm 开发者,构建其所需的基础框架、技术和规范,带来新一代的 AI 体验。
Arm 执行副总裁兼首席架构师与院士 Richard Grisenthwaite 表示:“AI 的广泛应用依赖于软、硬件创新的持续协同。小到边缘侧运行工作负载的小型传感器,大到处理复杂工作负载以训练大语言模型 (LLM) 的大型服务器,软硬件的协同发展将在每个技术节点中,助力 AI 能力的提升。随着整个生态系统不断发掘 AI 的真正潜力,我们也将面临安全性、可持续性和数据瓶颈等诸多挑战。因此,继续探索行业内的协作至关重要,为此,我们才能实现 AI 的规模化,包括加大边缘侧的推理能力。”
助力边缘 AI 发展
当下生成式 AI 和 LLM 正成为人们关注的焦点,而鉴于在智能手机领域,70% 的第三方 AI 应用都运行在 Arm CPU 上,Arm 已引领边缘 AI 长达多年。在探索如何以可持续的方式实现 AI 并高效传输数据的同时,行业也需要继续发展以实现在边缘侧运行 AI 和机器学习 (ML) 模型,然而,开发者在此却面临着计算资源日益受限的难题,使这个任务的实现充满了挑战。
Arm 正与 NVIDIA 展开合作,针对 NVIDIA TAO 进行适配。这是一套针对 Arm Ethos™-U NPU 使用的低代码开源 AI 工具包,有助于构建性能优化的视觉 AI 模型,并将其部署于搭载 Ethos-U 的处理器上。NVIDIA TAO 提供了一个易使用的界面,可在免费且开源的领先 AI 和 ML 框架——TensorFlow 和 PyTorch 上进行构建工作,为开发者带来轻松无缝的模型开发和部署环境,同时赋能边缘设备实现更复杂的 AI 工作负载,提升 AI 体验。
在所有设备与市场中推动神经网络的应用
在边缘侧推进神经网络的部署是实现 AI 可持续增长的重要一环。Arm 携手 Meta,通过 ExecuTorch,将 PyTorch 引入基于 Arm 架构的边缘侧移动和嵌入式平台。ExecuTorch 可助力开发者更轻松地在移动和边缘设备上,部署先进的 AI 和 ML 工作负载所需的先进神经网络。Arm 与 Meta 的合作将确保通过 PyTorch 和 ExecuTorch,开发者能在未来更轻松地开发和部署 AI 与 ML 模型。
与 Meta 的合作依托于 Arm 在 Tensor 运算符集架构 (TOSA) 方面的巨大投入,TOSA 为 AI 和 ML 加速器提供了通用框架,并支持广泛的深度神经网络工作负载。在基于 Arm 架构的各种处理器和数十亿的设备上,TOSA 也将成为 AI 和 ML 的坚实基石。
推动产业规模化的 AI
若要以相对低的成本实现 AI 规模化落地,支持广泛的数据格式至关重要。Arm 一直在为诸多专注于 AI 工作负载的新型小数据类型提供支持。
去年,Arm、英特尔和 NVIDIA 联合发布了新型 8 位浮点规范,即“FP8”。自此 FP8 格式发展迅猛,参与合作的企业已扩大至 AMD、Arm、谷歌、英特尔、Meta 和 NVIDIA,并共同制定了正式的 OCP 8 位浮点规范 (OFP8)。在最新的 A-profile 架构更新中,Arm 添加了与该标准一致的 OFP8,以助力其在行业内神经网络中的快速普及。OFP8 是交换 8 位数据格式,使软件生态系统能够轻松共享神经网络模型,从而不断提高数十亿设备上的 AI 计算能力。
开放的标准对于推动 AI 生态系统的创新、一致性与互操作性至关重要。为继续支持相关标准的行业协作,Arm 于近日正式加入了 MX 联盟,该联盟旗下成员包括了 AMD、Arm、英特尔、Meta、微软、 NVIDIA 和高通技术公司。近期,MX 联盟针对名为微扩展的新技术,进行技术规范的合作。这项技术基于芯片设计领域多年的探索与研究,是一种用于 AI 应用的窄位(8 位和 8 位以下)训练与推理的精细扩展方法。该规范对窄位数据格式进行了标准化,以消除行业的碎片化,实现 AI 的规模化。
秉承合作精神,MX 联盟通过开放计算项目 OCP,以开放、免许可的形式发布了 MX 规范。OCP 项目由超大规模数据中心运营商和计算基础设施领域的其他行业参与者组成,旨在促进相关技术在业内的广泛采用。这也体现了各方认识到在生态系统中对可扩展 AI 解决方案提供公平访问的必要需求。
前所未有的 AI 创新
Arm 已成为全球 AI 部署的基础。Arm 致力于为开发者提供构建先进、复杂的 AI 工作负载所需的技术,而上述的种种合作只是Arm 众多举措中的一部分。从传感器、智能手机和软件定义汽车,到服务器和超级计算机,Arm 将成为未来 AI 发展的基石。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。