过去一年,我们见证了AI技术对移动设备带来的变革,设备端AI正重新定义智能手机的“智能性”。
近日,Arm宣布推出Arm终端计算子系统(CSS),为旗舰系统级芯片(SoC)提供基础计算要素,其中包括最新的Armv9.2 CPU、Arm Immortalis GPU、基于三纳米工艺生产就绪的CPU和GPU物理实现,以及最新的CoreLink系统互连和系统内存管理单元(SMMU)。

Arm终端事业部产品管理副总裁James McNiven表示,随着AI复杂性和计算需求的指数级增长,Arm不断迭代产品及解决方案,善用最新工艺节点,提供实现设备端AI的坚实基础,简化了基于Arm架构的解决方案构建流程,确保高性能与计算能力的实现,加速产品上市。
性能和效率的新标杆
专为性能和AI而设计的Armv9架构作为未来十年计算的基础,自2021年推出以来,显著提升了AI、机器学习(ML)等领域的计算能力,并增强了系统安全。同时,Arm终端CSS凭借出色的性能与可扩展性,覆盖从笔记本电脑到可穿戴设备的广泛产品,使合作伙伴能够根据需求定制解决方案。
新的Arm Cortex-X925实现了Cortex-X系列推出以来最高的同比性能提升,该CPU利用了领先的三纳米工艺节点,在3.8GHz的时钟速率和最大缓存大小的条件下,与2023年旗舰智能手机的四纳米SoC相比,其单线程性能大幅提高36%。而在AI性能方面,Cortex-X925取得了惊人的41%性能提升,可显著提高如大语言模型(LLM)等设备端生成式AI的响应能力。
新的Arm Cortex-A725 CPU将对前沿性能的不懈追求与出色的效率相结合,该CPU将针对AI和手游用例的性能效率提高了35%。这一改进也得益于更新后的Arm Cortex-A520 CPU和更新后的DSU-120,使得采用最新Armv9 CPU集群的消费电子设备可提升能效和可扩展性。
新的Arm Immortalis-G925 GPU是Arm性能最强、效率最高的GPU,在各款领先的手游应用中实现了37%的性能提升,并在多个AI和ML网络上提升了34%的性能。Immortalis-G925面向旗舰智能手机市场,而包括Arm Mali-G725和Mali-G625 GPU在内的全新高可扩展性GPU系列,则面向从高端手机到智能手表和XR可穿戴设备等广泛的消费电子设备市场。
此外,Arm在安全技术方面也取得重要进展,内存标记扩展(Memory Tagging Extension,MTE)被vivo、Google等旗舰设备采用,有效减少安全漏洞。

vivo首席芯片规划专家夏晓菲表示,vivo非常注重用户体验,在Arm CSS的技术基础之上,vivo与Arm的密切合作,共同推动开发者生态,使手机更流畅更好用,同时也为设备端带来了前沿的AI体验。vivo很高兴看到Arm终端CSS所引入的新方向,以及通过Armv9 CPU与Arm GPU,这套计算子系统将赋能新一代设备端生成式AI,从而实现沉浸式的智能移动端解决方案。
卓越的开发者创新优化软件
Arm 始终关注全球数百万的开发者,确保他们能够获得打造下一波AI应用所需的性能、工具和软件库。为了使开发者能够以最高性能快速实现这些创新,Arm推出了Arm Kleidi,其中包括面向AI工作负载的KleidiAI和面向计算机视觉应用的 KleidiCV。这意味着开发者能更容易在Arm CPU上实现AI和计算机视觉的高性能部署,进一步促进了AI应用的普及。
KleidiAI 是一套面向AI框架开发者的计算内核,使他们能够在各种设备上轻松获得Arm CPU上的最佳性能,并支持 Neon、SVE2和SME2等关键Arm架构功能。KleidiAI与PyTorch、Tensorflow、MediaPipe 等热门AI框架集成,旨在加速Meta Llama 3、Phi-3等关键模型的性能,并且还可前后兼容,以确保Arm在引入更多技术时依然能适用未来市场的需求。
Windows on Arm生态系统亦迎来丰收年,原生应用日益增多,Arm与微软合作,通过资助开源和发布面向Windows的Arm Performance Libraries(Arm 性能库)来发展这个生态系统,为用户提供流畅的原生应用体验。
可以看出,Arm致力于为合作伙伴生态系统提供所需性能,同时通过持续的软件投资,为开发者构建了一个快速且卓越的AI开发平台。相信在未来,Arm也将继续投资于Armv9的新增AI和安全功能,与生态系统伙伴紧密协作,确保开发者能够获得必要的工具和软件库,共同塑造AI应用的未来。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。