Nvidia升级NeMo Megatron开发工具以加速AI训练

Nvidia今天推出了新版本的NeMo Megatron AI开发工具，该工具将让软件团队能够更快地训练神经网络。

而且，这次更新有望缩短训练高级自然语言处理模型所需的时间。

2020年，人工智能研究小组OpenAI推出了一种名为GPT-3的复杂自然语言处理模型。该模型可以执行从翻译文本到生成软件代码的各种任务。OpenAI提供的商业云服务让企业能够使用GPT-3的多个专业版本，并创建自己的自定义版本。

Nvidia今天更新的AI开发工具NeMo Megatron现在包含了针对训练GPT-3模型而优化的功能，预计这些功能可以将训练时间缩短多达30%。

Nvidia研究人员在今天发表的一篇博文中表示：“现在可以在24天内使用1024个NVIDIA A100 GPU对1750亿个参数模型进行训练，相比新版本发布之前，获得结果的时间缩短了10天，或大约250000小时的GPU计算时间。”

之所以能够得到加速得益于两项特性，即序列并行性和选择性激活重新计算。据Nvidia称，这两项功能都以不同方式对AI训练进行了加速。

GPT-3等AI模型由所谓层的软件构建块组成，每一层都执行一部分计算，神经网络利用这部分计算资源将数据转化为洞察力。加速AI训练常用的一种方法是配置神经网络层，以便计算可以并行执行，而不是一个接一个地执行，从而节省了时间。

序列并行性是此次NeMo Megatron新增的第一个功能，它使用相同的方法来加快处理速度。根据Nvidia的说法，这项新功能可以对以前只能按顺序一个一个执行的计算进行并行化，从而提高性能，并减少了多次执行相同计算的需要。

选择性激活重新计算是NeMo Megatron的另一个新功能，进一步减少了必须重复的计算次数。该功能通过优化所谓激活的计算操作来实现这一点，AI模型可以利用该功能处理数据。如果激活过程中必须重新计算的话，NeMo Megatron能够比以前更有效地执行此操作，从而缩短AI训练时间。

Nvidia还详细介绍了NeMo Megatron引入的另一项重大改进——超参数优化工具。超参数是软件团队在开发过程中为AI模型定义的配置设置，以优化其性能。使用Nvidia的超参数优化工具，软件团队就可以自动执行任务中涉及的一些手动工作。

开发人员可以指定AI模型的延迟或吞吐量级别，并让新工具自动找到满足要求所需的超参数。据Nvidia称，该功能对于优化AI训练过程特别有用，在一次内部测试中，Nvidia研究人员将GPT-3模型的训练吞吐量提高了30%。

Nvidia研究人员详细说明称：“我们在24小时内达到了175B GPT-3模型的最佳训练配置，与使用完全激活重新计算的常见配置相比，实现了吞吐量20%-30%的加速。”

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

Nvidia升级NeMo Megatron开发工具以加速AI训练

来源：至顶网计算频道

2022

07/29

15:46

分享

点赞

英伟达成为首家市值突破5万亿美元的公司

AWS雷尼尔人工智能超级集群正式上线运行

Fitbit应用迎来史上最大改版：AI健身教练Coach正式亮相

Zoom携手英伟达打造企业级定制AI新时代

Nokia与Zayo联手打造面向未来的IP网络基础设施

IBM发布小型开源Granite 4模型，专为移动设备和浏览器设计

Anomalo推出智能数据分析师AIDA，为企业数据质量监控带来生成式AI功能

英伟达与思科深化合作：推动6G和电信领域AI创新

德国能源巨头E.ON携手诺基亚推进通信网络现代化升级

众智有为 致敬同路人｜从ICT集成商到数智化赋能者，众诚科技的三十载进化论

NVIDIA 与世界领先企业共同加速无人驾驶出租车的全球部署

当AI数学助手开始说谎：INSAIT和ETH揭示大语言模型在定理证明中的谄媚陷阱

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

NVIDIA Blackwell 现已在云端全面可用

专访DeepMind CEO：我们距离实现AGI只需5-10年

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

众智有为致敬同路人｜从ICT集成商到数智化赋能者，众诚科技的三十载进化论