Arm的使命是助力应对AI 无止尽的能源需求

Arm CPU正在从根本上推动AI变革，并造福地球。Arm架构是未来AI计算的基石。

为 AI 数据中心工作负载供电的挑战（与机遇）

作者：Arm 首席执行官 Rene Haas

人工智能 (AI) 具有超越过去一个世纪所发生的所有变革性创新的潜力，它在医疗保健、生产力、教育等领域为社会带来的益处将超乎我们的想象。为了运行这些复杂的 AI 工作负载，全球数据中心所需的计算量需要以指数级规模进行扩展。然而，这种对计算无止尽的需求也揭示了一个严峻的挑战：数据中心需要庞大的电力来驱动AI这一突破性技术。

当今的数据中心已经消耗了大量的电力——全球每年需要 460 太瓦时 (TWh) 电力进行支持，这个数字等同于整个德国的用电量。而 AI 的兴起预计将在 2030 年把该数字提高三倍，意味着将超过印度这一世界上人口最多国家的总耗电量。

未来的 AI 模型将持续变得更大、更智能，在带动对更多计算能力的需求的同时，对电力的需求也会增加，从而成为良性循环的一部分。而找到降低这些大型数据中心电力需求的方法对于实现社会性突破和兑现 AI 的承诺至关重要。

换言之，没有电力就无法实现 AI，企业需要重新思考如何应对能效问题的方方面面。

重新构思 AI 的未来——一个由 Arm 平台驱动的未来

Arm 最初的产品就是为使用电池的设备而设计的，并推动了移动电话的变革。因此，深植于 Arm 的能效 DNA能使业界重新思考应如何构建芯片来满足 AI 日益增长的需求。

在典型的服务器机架中，仅计算芯片就可以消耗超过 50% 的电力预算。工程团队正在寻找各种可以降低该数字的方法，每一瓦特的减少都至关重要。

正因为此，全球最大的 AI 头部云服务提供商们转而采用 Arm 技术来降低功耗。与同行业中的其他产品相比，Arm 最新的 Arm Neoverse CPU 是面向云数据中心，性能最高、最节能的处理器。Neoverse 为头部云服务提供商提供了定制芯片的灵活性，以优化其苛刻的工作负载，同时提供领先的性能和能效。每一瓦特的节省都可以用来实现更多的计算。这也正是为什么亚马逊云服务 (AWS)、微软、Google 和甲骨文 (Oracle) 现在都通过 Neoverse 技术，处理其通用计算和基于 CPU 的 AI 推理和训练。Neoverse 平台正在成为云数据中心领域的事实标准。

从近期的行业内的发布来看：

基于 Arm 架构的 AWS Graviton：与其他同行业产品相比，Amazon Sagemaker 的 AI 推理性能提高了 25%，Web 应用程序提高了 30%，数据库提高了 40%，效率则提升了 60%。
基于 Arm 架构的 Google Cloud Axion：与传统架构相比，其性能和能效分别提高了 50% 和 60%，可为基于 CPU 的 AI 推理和训练、YouTube、Google 地球等服务提供支持。
基于 Arm 架构的 Microsoft Azure Cobalt：性能高出同类产品 40%，并为 Microsoft Teams 等服务提供支持，与 Maia 加速器的耦合驱动 Azure 的端到端 AI 架构。
Oracle Cloud 采用基于 Arm 架构的 Ampere Altra Max：与传统同类产品相比，每机架服务器的性能提高 2.5 倍，能耗降低 2.8 倍，并用于生成式 AI 推理模型，诸如摘要、大语言模型训练的数据的标记化，以及批量推理用例。

显然，Neoverse 极大地提升了云端通用计算的性能和能效。此外，合作伙伴也发现在加速计算方面，Neoverse 也能带来同样的益处。大规模 AI 训练需要独特的加速计算架构，例如，NVIDIA Grace Blackwell 平台 (GB200) 结合了 NVIDIA 的 Blackwell GPU 架构与基于 Arm 架构的 Grace CPU。这种基于 Arm 技术的计算架构可实现系统级设计优化，与面向大语言模型的 NVIDIA H100 GPU 相比，可带来 25 倍的能耗降低，并将每个 GPU 的性能提高 30 倍。这些优化能够带来颠覆性的性能和节能效果，而这一切都得益于 Neoverse 所带来的前所未有的芯片定制灵活性。

随着基于Arm 架构的部署持续扩大，这些企业将可以节省高达 15% 的数据中心总能耗。这些巨幅的节省可以用来在相同的功率范围内驱动额外的 AI 运算，而不会增加能源负担。换言之，这些节能相当于可以额外运行 20 亿次 ChatGPT 查询，驱动四分之一的日常网络搜索流量，为 20% 的美国家庭提供照明，或为与哥斯达黎加面积相仿的国家进行供电。这对改善能源消耗和环境可持续性产生了惊人的影响。

Arm CPU 正在从根本上推动 AI 变革，并造福地球。Arm 架构是未来 AI 计算的基石。

来源：业界供稿

0赞

好文章，需要你的鼓励

Arm的使命是助力应对AI 无止尽的能源需求

来源：业界供稿

2024

04/23

11:48

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

一颗192核的Arm服务器CPU

Arm技术媒体分享日：探索AI时代的计算前沿与生态布局

引领AI时代计算新纪元：Arm终端计算子系统重塑智能设备性能边界

Arm亮相COMPUTEX 2024： 预计2025年底超过1000亿台Arm设备可用于AI

Arm推出人工智能优化的Arm终端计算子系统以及新的Arm Kleidi软件，重新定义移动端体验

《日经亚洲》报道Arm明年将推首款产品进军人工智能芯片市场

让智能手机与PC具备领先的AI计算性能 下一代Arm Cortex-X内核信息“浮出水面”

Arm的使命是助力应对AI 无止尽的能源需求

能效和定制化将推动ARM在人工智能领域发挥关键作用

加速边缘AI部署 Arm推出Ethos-U85 NPU和Corstone-320

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Arm亮相COMPUTEX 2024：预计2025年底超过1000亿台Arm设备可用于AI

让智能手机与PC具备领先的AI计算性能下一代Arm Cortex-X内核信息“浮出水面”