Meta与NVIDIA联合打造大型AI研究超级计算机

Meta的AI超级计算机是迄今为止最大的NVIDIA DGX A100客户系统。该系统将为Meta的AI研究人员提供5百亿亿次级AI计算性能，采用了最先进的NVIDIA系统、InfiniBand网络和软件，实现了数千个GPU集群的系统优化。

Meta的AI超级计算机是迄今为止最大的NVIDIA DGX A100客户系统。该系统将为Meta的AI研究人员提供5百亿亿次级AI计算性能，采用了最先进的NVIDIA系统、InfiniBand网络和软件，实现了数千个GPU集群的系统优化。

Meta Platforms充分认可NVIDIA，为其有望成为有史以来最强大的研究系统选择了NVIDIA的先进技术。

于今日发布的AI研究超级集群（RSC）已在训练新模型以推动AI发展。

全面部署后，Meta的RSC预计将成为最大的NVIDIA DGX A100客户系统。

Meta在一篇博客文章中表示：“我们希望RSC帮助我们建立全新的AI系统，例如可以为多个不同语言的团队提供实时语音翻译，使他们可以在研究项目上无缝协作，甚至一起玩AR游戏。”

训练最大的AI模型

当RSC在今年晚些时候完全建成时，Meta将用它来训练具有超过1万亿个参数的AI模型。这将推动自然语言处理等领域的发展，比如实时识别不法内容等工作。

除了实现规模性能之外，Meta还将超高的可靠性、安全性、隐私性以及处理“各类AI模型”的灵活性作为RSC的关键指标。

Meta与NVIDIA联合打造大型AI研究超级计算机

Meta的AI研究超级集群拥有数百个NVIDIA DGX系统并通过NVIDIA Quantum InfiniBand网络相连接，助力Meta AI研究团队提高工作速率。

性能大揭秘

目前，此全新AI超级计算机已经部署了760个NVIDIA DGX A100系统作为其计算节点。共有6080个NVIDIA A100 GPU，通过NVIDIA Quantum 200Gb/s InfiniBand网络连接，可提供1895千万亿次TF32计算性能。

尽管受到新冠疫情的影响，这样一台可运行的AI超级计算机从想法到实现，RSC仅用了18个月！ “功臣”之一便是采用NVIDIA DGX A100技术作为基石。

Penguin Computing是NVIDIA合作伙伴网络中负责RSC交付的合作伙伴。除了760个DGX A100系统和InfiniBand网络之外，Penguin还为Meta提供管理服务和AI基础架构优化，包括一个46PB高速缓存的Altus系统。

性能提升20倍

这是Meta第二次选择NVIDIA技术作为其研究平台的基础。2017年，Meta打造了第一代AI研究基础架构，配备了22000个NVIDIA V100 Tensor Core GPU，每日可处理35000项AI训练工作。

Meta的早期基准测试显示，RSC训练大型NLP模型的速度比之前的系统快3倍，运行计算机视觉工作的速度比之前的系统快20倍。

在今年晚些时候的第二阶段，RSC将扩展至16000个GPU。Meta认为届时RSC将提供高达5百亿亿次级混合精度AI计算性能，并且Meta希望通过扩展RSC的存储系统，以每秒16TB的速度提供高达1EB的数据。

可扩展架构

NVIDIA AI技术适用于任何规模的企业应用。

NVIDIA DGX包含一个完整的NVIDIA AI软件栈，可以轻松地从单个系统扩展至完整的DGX SuperPOD，可以在本地或主机托管商处运行。客户亦可以通过NVIDIA DGX Foundry租用DGX系统。

点评：

Meta的AI超级计算机是NVIDIA DGX A100的又一重磅应用落地，此前美国能源部的阿贡国家实验室（Argonne National Laboratory）也采购了DGX A100系统，运用该集群的AI和计算力来更好地研究和应对COVID-19。

DGX A100的优势是提供一站式训练、推理、数据分析平台，其集成了8个全新NVIDIA A100 Tensor Core GPU，具有320GB内存用以训练最大型的AI数据集，以及最新的高速NVIDIA Mellanox HDR 200Gbps互连。

这样用户可在一个完全集成的软件定义平台上根据自己的需求优化计算力和资源，加快数据分析、训练和推理等各种工作负载的速度，这些特性让企业搭建AI平台更加便捷。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

Meta与NVIDIA联合打造大型AI研究超级计算机

来源：至顶网计算频道

2022

01/26

15:41

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

NVIDIA 初创加速计划 | 2024 NVIDIA 创业企业展示完美收官!

老黄掏出“迷你版AI超算”，每秒67万亿次运算，仅售2070元人民币

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会