Arm® 今日宣布多项全新的战略合作,继续致力于推动人工智能 (AI) 的创新,并将 AI 的体验变为现实。除了自身已能实现 AI 开发的技术平台之外,Arm 还与 AMD、英特尔、Meta、微软、NVIDIA 和高通技术公司等领先的科技企业携手合作,通过多项计划,聚焦于先进 AI 能力的实现,由此带来更快响应、更加安全的用户体验。这些合作计划将在所有计算进行之处,助力 1500 多万名 Arm 开发者,构建其所需的基础框架、技术和规范,带来新一代的 AI 体验。
Arm 执行副总裁兼首席架构师与院士 Richard Grisenthwaite 表示:“AI 的广泛应用依赖于软、硬件创新的持续协同。小到边缘侧运行工作负载的小型传感器,大到处理复杂工作负载以训练大语言模型 (LLM) 的大型服务器,软硬件的协同发展将在每个技术节点中,助力 AI 能力的提升。随着整个生态系统不断发掘 AI 的真正潜力,我们也将面临安全性、可持续性和数据瓶颈等诸多挑战。因此,继续探索行业内的协作至关重要,为此,我们才能实现 AI 的规模化,包括加大边缘侧的推理能力。”
助力边缘 AI 发展
当下生成式 AI 和 LLM 正成为人们关注的焦点,而鉴于在智能手机领域,70% 的第三方 AI 应用都运行在 Arm CPU 上,Arm 已引领边缘 AI 长达多年。在探索如何以可持续的方式实现 AI 并高效传输数据的同时,行业也需要继续发展以实现在边缘侧运行 AI 和机器学习 (ML) 模型,然而,开发者在此却面临着计算资源日益受限的难题,使这个任务的实现充满了挑战。
Arm 正与 NVIDIA 展开合作,针对 NVIDIA TAO 进行适配。这是一套针对 Arm Ethos™-U NPU 使用的低代码开源 AI 工具包,有助于构建性能优化的视觉 AI 模型,并将其部署于搭载 Ethos-U 的处理器上。NVIDIA TAO 提供了一个易使用的界面,可在免费且开源的领先 AI 和 ML 框架——TensorFlow 和 PyTorch 上进行构建工作,为开发者带来轻松无缝的模型开发和部署环境,同时赋能边缘设备实现更复杂的 AI 工作负载,提升 AI 体验。
在所有设备与市场中推动神经网络的应用
在边缘侧推进神经网络的部署是实现 AI 可持续增长的重要一环。Arm 携手 Meta,通过 ExecuTorch,将 PyTorch 引入基于 Arm 架构的边缘侧移动和嵌入式平台。ExecuTorch 可助力开发者更轻松地在移动和边缘设备上,部署先进的 AI 和 ML 工作负载所需的先进神经网络。Arm 与 Meta 的合作将确保通过 PyTorch 和 ExecuTorch,开发者能在未来更轻松地开发和部署 AI 与 ML 模型。
与 Meta 的合作依托于 Arm 在 Tensor 运算符集架构 (TOSA) 方面的巨大投入,TOSA 为 AI 和 ML 加速器提供了通用框架,并支持广泛的深度神经网络工作负载。在基于 Arm 架构的各种处理器和数十亿的设备上,TOSA 也将成为 AI 和 ML 的坚实基石。
推动产业规模化的 AI
若要以相对低的成本实现 AI 规模化落地,支持广泛的数据格式至关重要。Arm 一直在为诸多专注于 AI 工作负载的新型小数据类型提供支持。
去年,Arm、英特尔和 NVIDIA 联合发布了新型 8 位浮点规范,即“FP8”。自此 FP8 格式发展迅猛,参与合作的企业已扩大至 AMD、Arm、谷歌、英特尔、Meta 和 NVIDIA,并共同制定了正式的 OCP 8 位浮点规范 (OFP8)。在最新的 A-profile 架构更新中,Arm 添加了与该标准一致的 OFP8,以助力其在行业内神经网络中的快速普及。OFP8 是交换 8 位数据格式,使软件生态系统能够轻松共享神经网络模型,从而不断提高数十亿设备上的 AI 计算能力。
开放的标准对于推动 AI 生态系统的创新、一致性与互操作性至关重要。为继续支持相关标准的行业协作,Arm 于近日正式加入了 MX 联盟,该联盟旗下成员包括了 AMD、Arm、英特尔、Meta、微软、 NVIDIA 和高通技术公司。近期,MX 联盟针对名为微扩展的新技术,进行技术规范的合作。这项技术基于芯片设计领域多年的探索与研究,是一种用于 AI 应用的窄位(8 位和 8 位以下)训练与推理的精细扩展方法。该规范对窄位数据格式进行了标准化,以消除行业的碎片化,实现 AI 的规模化。
秉承合作精神,MX 联盟通过开放计算项目 OCP,以开放、免许可的形式发布了 MX 规范。OCP 项目由超大规模数据中心运营商和计算基础设施领域的其他行业参与者组成,旨在促进相关技术在业内的广泛采用。这也体现了各方认识到在生态系统中对可扩展 AI 解决方案提供公平访问的必要需求。
前所未有的 AI 创新
Arm 已成为全球 AI 部署的基础。Arm 致力于为开发者提供构建先进、复杂的 AI 工作负载所需的技术,而上述的种种合作只是Arm 众多举措中的一部分。从传感器、智能手机和软件定义汽车,到服务器和超级计算机,Arm 将成为未来 AI 发展的基石。
好文章,需要你的鼓励
随着5G流量快速增长和新用例不断涌现,网络运营商需要在最小化环境影响的同时管理密集网络使用。Orange法国与爱立信合作开展创新试验,测试FDD大规模MIMO天线集成无线电,优化高流量区域频谱使用。双方还探索Cloud RAN和Open RAN架构,通过虚拟化RAN功能实现灵活的软件中心网络。合作重点关注利用AI驱动的自动化和意图驱动技术提升能源效率,在不影响性能的前提下动态调整网络资源以降低能耗。
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
微软正在将Windows 11改造为"智能代理操作系统",在任务栏中集成AI代理功能。新功能允许AI代理在后台执行任务,用户可通过任务栏图标查看进度状态。微软还在文件资源管理器中集成Copilot,提供文档摘要、文件问答等功能。此外,Click to Do功能得到改进,可将网页表格转换为Excel文档。这些AI功能采用本地AI和云端AI混合模式,为用户提供更智能的操作体验。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。