浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

近日，淮海智算中心携手浪潮信息进行了超大规模参数AI大模型训练性能测试，实测数据表明，千亿参数规模的自然语言AI单体大模型在淮海智算中心计算平台上的训练算力效率达53.5%，刷新了业内AI大模型训练算力效率新高。

近日，淮海智算中心携手浪潮信息进行了超大规模参数AI大模型训练性能测试，实测数据表明，千亿参数规模的自然语言AI单体大模型在淮海智算中心计算平台上的训练算力效率达53.5%，刷新了业内AI大模型训练算力效率新高。这意味着淮海智算中心将可为国内生成式AI创新团队提供高性能、高效率的AI大模型训练算力服务。

生成式AI需要基于海量的自然语言或多模态数据集，对拥有巨大参数的超大规模AI模型进行训练，其训练所需AI算力当量非常高，如以PD(Petaflops-Day)为单位来衡量，OpenAI的GPT-3大模型训练的算力当量为3640PD，而浪潮“源1.0”大模型的算力当量则为4095PD。

超大规模AI大模型的训练一般必须在拥有成百上千加速卡的AI服务器集群上进行，如何在AI计算集群上获得更高的训练算力效率则会直接影响到模型训练时长以及算力消耗成本，这对于提升生成式AI研发创新效率有着非常重要的影响。据公开资料表明，GPT-3大模型在其V100 GPU集群上的训练算力效率为21.3%，而浪潮“源1.0”的训练算力效率则达到了44.8%。

针对AI大模型训练的计算特点，浪潮信息AI团队对淮海智算中心算力系统进行了专业设计，对集群架构、高速互联、算力调度等方面进行全面优化，在系统架构上，采用单节点集成8颗加速器的AI服务器，节点内加速器间实现超高速P2P通信，节点间建立极低延迟、超高带宽的Infiniband通信网络。在大模型训练技术层面，成功运用了中文巨量AI模型“源1.0”的训练优化经验，对分布式训练策略进行了针对性优化，通过合理设计张量并行、流水并行和数据并行，精准调整模型结构和训练过程的超参数，最终实现了千亿参数规模AI大模型的训练算力效率达到53.5%。

浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

千亿参数AI模型结构及其实际性能表现

淮海智算中心由安徽省宿州市与浪潮共同推进建设，目标是建成技术先进、架构开放、应用丰富、生态完善的国内领先智算枢纽。淮海智算中心将依靠领先的算力、算法基础设施，开放的技术架构，成熟丰富的生态应用，面向全国提供智能算力、数据和算法服务，打造良好的智算产业生态。

来源：业界供稿

浪潮

0赞

好文章，需要你的鼓励

浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

来源：业界供稿

2023

02/20

18:28

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

提速！浪潮网络“产品-方案-服务“能力全线升级

浪潮网络2024新品发布暨合作伙伴大会圆满落幕

浪潮KaiwuDB论文被数据库国际顶会ICDE2024录用

浪潮云海InCloud Sphere再次登顶SPECvirt全球第一

浪潮KaiwuDB魏可伟：AIoT，用行业定义数据库

加速数据价值兑现 浪潮海若大模型带来新动能

浪潮海若大模型业务战略正式发布

浪潮网络推出单芯片CLOS架构方案 打造极致简约的网络互联体验

落地南京！浪潮信息携手多伦科技打造，这款智慧路口可以“千城千面”！

浪潮KaiwuDB通过中国信通院“可信数据库”性能与稳定性评测

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

加速数据价值兑现浪潮海若大模型带来新动能

浪潮网络推出单芯片CLOS架构方案打造极致简约的网络互联体验