凭借 Arm CSS 和 KleidiAI 等技术创新,Arm 首席执行官 Rene Haas 预计,到 2025 年底,将有超过 1,000 亿台基于 Arm 架构设备可用于 AI。
在 COMPUTEX 2024 展前,Arm 首席执行官 Rene Haas 分享了公司将如何实现到 2025 年底让超过 1,000 亿台基于 Arm 架构设备可用于从云端到边缘侧的人工智能 (AI)。

我们有足够的能源来支持 AI 吗?
Haas 回应的关键问题之一在于,全球是否有足够多的能源来满足日益增长的 AI 计算需求。AI 领域已涌现出诸多卓越创新,然而行业正面临一个两难境地,即处理器越能更好地处理 AI 的性能要求,其能源需求也随之增大。
Arm 的 DNA 诞生于面向使用电池的设备。Haas 认为,正因如此,亚马逊云科技 (AWS)、谷歌 (Google) 和微软 (Microsoft) 等主流云服务提供商才会越来越多地采用 Arm 架构。他还谈到,Arm 是世界上最具能效的 CPU,所节约的能耗推动了令人惊叹的 AI 创新。
软件至关重要
在 30 余年的公司历史中,Arm 以领先的能效最为人所知,也是使其成为全球应用最普及的计算平台的根基。不仅于此,Haas 还进一步指出,真正让 Arm 与众不同的是无可比拟的软件生态系统。
正如 Haas 所言,Arm 已成为世界上各类主要操作系统的选择。微软近期发布的 AI PC 就是一个很好的例子,其中最常用的应用现在均可在 Windows on Arm (WoA) 上原生运行。事实上,在拥有 1,800 万软件开发者的生态系统中,如今在 Arm CPU 上进行设计的开发者比在其他任何处理器上都要多。
如果我们想体验 AI 所能释放的社会变化,从边缘侧最微小的设备到云端训练和推理,开发者支持至关重要。开发者需要能够利用 AI 进行创新,并使其以高性能、功耗优化、高度可执行和可预测的状态在硬件上运行。
为了确保在 Arm 计算平台上实现这一点,Haas 介绍了新推出的 Arm KleidiAI,其包含于一套新的 AI 计算库中,使开发者能够更轻松地在 Arm 平台上运行他们的 AI 应用。 Haas 补充道:“在 Arm 过去 30 多年的发展中我们切实学到,为开发者提供所能获取的资源,与硬件同等重要,否则硬件也无法发挥其作用。”

例如,当开发者在 TensorFlow、PyTorch、Llama 3 和 MediaPipe 等框架中处理他们的模型时,KleidiAI 使他们能够进入抽象层并利用 AI 工作负载的底层硬件功能来充分发挥其性能潜力。
从生态系统角度而言,KleidiAI 也深具优势,现场 Haas 分享了来自三星、Meta 和谷歌高管的视频,他们各自讲述了 Arm 和 KleidiAI 将如何助力他们在多个市场加速 Arm 平台上的 AI 创新。
Arm 终端 CSS
除了 Arm 赋能 AI 开发者生态系统所做的出色工作外,Arm 将持续提供更高性能、更具能效的产品。Arm高级副总裁兼终端事业部总经理 Chris Bergey 现场分享了更多关于产品方面的信息,介绍了上周发布的 Arm 终端计算子系统 (CSS)。

这是 Arm 首次交付基于前沿的三纳米工艺节点的 Arm CPU 和 GPU 物理实现。Bergey 强调了其重要性,Arm 生态系统现在可以利用经验证、基于领先的三纳米工艺节点的 CPU 和 GPU 物理实现,并更快、更有信心地将产品推向市场。
Arm 终端 CSS 使芯片制造商能够专注于打造平台的差异化,以及切实考虑 Armv9 架构将如何赋能其新一代产品。与此同时,通过将终端 CSS 与 KIeidiAI 相结合,开发者将拥有充分利用这些下一代硬件技术所需的工具。
最后,Haas 再次强调,Arm 通过提供全球最完整的计算平台,致力于 AI 技术的发展。凭借 Arm CSS 和 KleidiAI 等技术创新,他预计到 2025 年底,将有超过 1,000 亿台基于 Arm 架构的设备可用于 AI。实现这一令人惊叹的数量不仅将会重塑这个行业,更是会重塑整个地球。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。