微软为美国Azure客户推出全新AI加速器Maia 200

微软宣布其美国中央数据中心率先部署新型AI推理加速器Maia 200。该产品采用台积电3nm工艺，配备FP8/FP4张量核心和216GB HBM3e高速内存，数据传输速度达7TB/秒。相比竞品，Maia 200的FP4性能是亚马逊Trainium三代的3倍，成本效率提升30%。微软计划在美国西部3区继续部署该技术。

微软宣布，其美国中部数据中心区域率先部署了全新人工智能推理加速器Maia 200。

微软将Maia 200描述为推理处理的强力引擎，采用台积电3纳米工艺制造，配备原生FP8/FP4（浮点）张量核心，以及重新设计的内存系统，使用216GB最新高速内存架构（HBM3e）。该系统每秒可传输7TB数据。Maia 200还提供272MB片上内存以及数据传输引擎，微软表示这些配置能够让大规模模型保持高效运行状态。

性能表现方面的突破

根据微软介绍，这些硬件特性使Maia 200的FP4性能是第三代Amazon Trainium的三倍，FP8性能超越谷歌第七代张量处理单元。微软称Maia 200是其迄今为止最高效的推理系统，相比现有系统提供30%的成本性能优势。不过，微软目前尚未公布该产品在美国以外地区的上市时间。

除了美国中部数据中心区域，微软还宣布位于亚利桑那州凤凰城附近的美国西部3区数据中心将成为下一个部署Maia 200的区域。

创新的架构设计

微软云计算和人工智能执行副总裁Scott Guthrie在博客中详细介绍了Maia 200的部署方式。该系统由机架托盘构成，每个托盘配置四个Maia加速器。每个托盘通过直接、非交换连接实现完全互联，确保高带宽通信的本地化，以获得最佳推理效率。

Guthrie表示，系统采用相同的通信协议进行机架内和机架间网络连接，使用Maia AI传输协议来扩展Maia 200加速器集群，同时将网络跳数降至最低。

"这种统一架构简化了编程复杂性，提升了工作负载灵活性，减少了资源浪费，同时在云规模下保持了一致的性能和成本效率。"Guthrie补充道。

Guthrie介绍，Maia 200采用了基于标准以太网的全新两层扩展设计。"定制传输层和紧密集成的网络接口卡释放了性能潜力，提供了强大的可靠性和显著的成本优势，而无需依赖专有架构。"

在实际应用中，每个加速器提供高达1.4TB每秒的专用扩展带宽。据Guthrie介绍，这使微软能够为多达6144个加速器的集群提供可预测的高性能集体操作。

软件开发的协同优化

从Guthrie的角度来看，Maia 200架构能够为密集推理集群提供可扩展的性能，同时降低Azure全球数据中心的功耗和总拥有成本。

在软件层面，Guthrie表示公司使用了复杂的仿真流水线来指导Maia 200从早期阶段的架构设计。该流水线涉及对大语言模型的计算和通信模式进行高保真建模。

"这种早期协同开发环境使我们能够将硅芯片、网络和系统软件作为统一整体进行优化，这一切都在首个硅芯片完成之前实现。"Guthrie说道。他还补充说，微软开发了重要的仿真环境，用于从底层内核验证到完整模型执行和性能调优的全过程。

作为产品推广的一部分，微软正为AI开发者提供Maia 200软件开发工具包的预览版本。

Q&A

Q1：Maia 200相比其他AI加速器有什么优势？

A：Maia 200采用台积电3纳米工艺，FP4性能是第三代Amazon Trainium的三倍，FP8性能超越谷歌第七代张量处理单元，相比现有系统提供30%的成本性能优势。每秒可传输7TB数据，每个加速器提供高达1.4TB每秒的专用扩展带宽。

Q2：Maia 200目前在哪些地区可以使用？

A：目前Maia 200首先部署在微软美国中部数据中心区域，位于亚利桑那州凤凰城附近的美国西部3区数据中心将是下一个部署区域。微软尚未公布该产品在美国以外地区的上市时间。

Q3：Maia 200的架构设计有什么特点？

A：Maia 200采用机架托盘构成，每个托盘配置四个加速器，通过直接非交换连接实现完全互联。使用基于标准以太网的两层扩展设计，支持多达6144个加速器的集群，并配备272MB片上内存和数据传输引擎。

来源：Computer Weekly

0赞

好文章，需要你的鼓励

微软为美国Azure客户推出全新AI加速器Maia 200

来源：Computer Weekly

2026

01/27

09:23

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

New Relic扩展ChatGPT嵌入应用的监控能力

智能体AI时代到来，清洁准确的数据变得更加重要

英国政府斥资3600万英镑大幅提升Dawn超级计算机性能

英特尔正式任命GPU工程资深专家埃里克·德默斯为高级副总裁

应用现代化让AI投资回报率提升三倍

AI红队测试：安全合规的基石

Synthesia获2亿美元融资，估值40亿美元打造AI虚拟人培训平台

构建成功人工智能战略的核心要素

担心就业市场？AI时代脱颖而出的五大方法

Google Photos推出"Me Meme"让用户制作个人专属表情包

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会