Horovod成就分布式深度学习金标准，Uber专家将在AI计算大会分享

8月28日，在北京举行的2019人工智能计算大会（AICC2019）上，Uber深度学习平台经理宁旭将在大会主论坛上分享如何更好的使用Horovod加速AI模型训练。

大多数人对Uber在人工智能领域的认知可能都来自于自动驾驶，但实际上Uber在人工智能底层技术上也有卓越的贡献，其开源的分布式深度学习框架Horovod是世界上最优秀的人工智能训练加速框架之一，数以万计的人工智能开发者和组织从中受益。8月28日，在北京举行的2019人工智能计算大会（AICC2019）上，Uber深度学习平台经理宁旭将在大会主论坛上分享如何更好的使用Horovod加速AI模型训练。

Horovod流行的背后是AI算力需求的急剧增加

Horovod实质上是Uber开发并开源的一套先进的分布式系统，它并不依赖于某个框架，而是采用目前业界广泛认可的基于环形All-reduce通信的同步SGD算法，通过计算与通信异步、梯度合并、梯度压缩等设备间通信优化手段，完成allreduce、allgather等集体操作通信工作。这一特性使得Horovod可以非常方便地与主流深度学习框架TensorFlow、PyTorch、 MXNet等进行匹配，在大规模GPU集群上的训练性能远高于原生框架的训练性能，提供非常高效的分布式训练性能加速。Horovod的另一大优点在于其提供的接口极为简单，用户只需修改几行代码，就可实现显著的训练性能提升。

Horovod之所以受到越来越多AI开发者与研究机构的青睐，其背后的原因在于越来越多的机器学习模型对数据和计算能力需求急剧增加。在大部分情况下，AI模型可以在单个或多GPU平台的服务器上运行，但随着数据集的增大和训练时间的增长，有时训练需要一周甚至更长时间。因此，AI开发者们不得不寻求分布式训练方法来缩短模型训练的时间。

Uber分享Horovod的“独家秘笈”

Uber目前已经将深度学习应用到了很多公司业务中，从自动驾驶搜索路线到防御欺诈等。Uber深度学习平台经理宁旭认为，训练现代复杂的深度学习模型需要大量的计算。将计算扩展到多个GPU面临两大挑战：低成本、高效的GPU间通信库，以及用户代码可能会出现较大的更改。而Horovod成功地解决了这两大难题。

在AICC2019上，宁旭将带来《利用Horovod进行分布式深度学习》的主题演讲，不仅将现场分享如何通过Horovod在TensorFlow、Keras、PyTorch和MXNet中实现更快、更轻松的分布式训练，讲解Horovod的操作方法，同时也将披露Uber最近在橡树岭国家实验室进行的一项案例研究，讲述Horovod在世界上最快的超级计算机上实现百亿亿级计算。

宁旭曾带领Uber大数据和基础设施领域的团队负责一些开源项目，在机器学习、深度学习、大数据和大规模计算、网络、存储问题方面有丰富的经验。在加入Uber之前，宁旭曾在Facebook、Akamai和Microsoft以及几家初创公司工作。

AICC2019精彩纷呈

本届AICC 2019可谓精彩纷呈，核心板块为主论坛与自动驾驶、产业AI创新、AI计算与基准测试、AI+视觉计算、AI+创投五大主题论坛，其中主论坛嘉宾云集了来自中国工程院、英国皇家工程院、百度、中国新一代人工智能发展战略研究院、浪潮、Facebook等机构的AI产学研顶尖专家学者，共聚一堂解读AI产业趋势，分享前沿AI计算技术。大会同期举行的AI千人训练营将邀请百度、平安科技、浪潮的资深AI工程师讲解最新AI计算技术与应用，帮助学员从零入门AI。

来源：业界供稿

0赞

好文章，需要你的鼓励

Horovod成就分布式深度学习金标准，Uber专家将在AI计算大会分享

Horovod流行的背后是AI算力需求的急剧增加

Uber分享Horovod的“独家秘笈”

AICC2019精彩纷呈

来源：业界供稿

2019

08/22

22:08

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

这款古怪的 AI 智能手机可以创建你的数字分身

Hugging Face 首席科学官担忧 AI 正在成为"服务器上的应声虫"

AI 公司效仿 DeepSeek，通过"蒸馏"技术打造低成本模型

物理 AI 如何通过嵌入式智能改变行业格局

Sergey Brin 表示：如果谷歌员工每周工作 60 小时，AGI 指日可待

Tencent 发布新 AI 模型，称速度快于 DeepSeek-R1

IBM 发布新的 Granite 3.2 系列模型，实现按需推理能力

Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

DeepSeek 超越"开放权重"AI，计划发布源代码

iPhone 16E 证明苹果急切希望用户使用其 AI 功能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: