Nvidia分析师简报会：Nvidia是如何实现加速计算的

前不久Nvidia举办了一场分析师简报会，Nvidia公司数据科学工程高级总监John Zedlewski介绍了Nvidia是如何实现加速计算，本文包含了对这次简报会的一些观点。

如今无论所见何处，数据密集型应用都在以惊人的速度增长着，而Nvidia是身处于这一发展趋势核心的公司之一，最近，Nvidia因其生产的AI芯片而一路走高。

几十年前，Nvidia就处于加速计算的基础层上，那个时候Nvidia取得了很大的进步，并且在过去的一两年里速度大大加快。谈到系统架构，John提出了一个有趣的观点。

他说：“所有这些硬件都很棒，尽管有时候有些奇特，但如果没有软件来运行硬件的话，就不会取得成功。我们希望让开发人员能够轻松地从这个极其复杂的硬件中获得最大性能，并让这样的性能轻松融入到您的应用领域。”

Zedlewski指出，Nvidia将产品打包在Nvidia AI等平台和端到端框架中，例如用于大型语言模型的Nemo和用于医学成像的Monet。大多数人认为，Nvidia是一家GPU制造商，尽管Nvidia在这个领域可以说是一流的企业，但它的系统方法领先于竞争对手英特尔和AMD。

Nvidia将GPU与软件开发套件、加速库、系统软件和硬件打包在一起，形成端到端的解决方案，这简化了使用Nvidia技术的过程，几乎变得“即插即用”。

他补充说，在训练大型语言模型之前，首先要确定所需的数据集（甚至可能与互联网上的所有文本一样广泛），这会带来大量数据科学和数据管理方面的问题。

他说：“如果你想有效地做到这一点，如果你希望能够迭代、细化和改进你的数据，你就需要一种加速它的方法，这样你就不必为每次迭代而等待数月了。我们总是从预测合作伙伴那里听到这样的说法。他们说，‘看，我们的遗留系统非常擅长每月和每周的预测。’”

这些合作伙伴需要一种方法来构建模型并且更快地运行这些模型以便进行预测，而不是每月、每周、甚至是每天，他们需要做到实时。速度在欺诈检测、基因组学和网络安全等其他应用中也是至关重要的，这些应用必须随着事件的展开而分析大量数据集。数据科学家使用的工具无法满足梳理大量数据存储的需求。

Nvidia的Triton是一个专门用于深度学习推理的开源推理平台，经过增强之后可以支持数据科学家和机器学习工程师仍在整个行业构建的许多基于树的模型。

Zedlewski表示：“我们越来越多地看到人们对包含矢量搜索的部署框架很感兴趣，无论是具有矢量搜索组件、图像搜索还是推荐系统的大型语言模型，所以我们还有RAPIDS Raft的矢量搜索加速器。”

Nvidia让数据科学家们能够轻松处理具有数亿行的数据集。而且Nvidia还认识到，没有一种工具可以包揽一切，因此Nvidia拥有100多个开源和商业软件集成。Zedlewski表示，这些集成是为了使各项工作顺利无缝地展开，从而让构建复杂的多组件管道变得更加简单。

Nvidia的GitHub开源项目有350名贡献者。Zedlewski表示，有超过25%的财富500强企业在使用RAPIDS，企业采用率还在不断上升。使用RAPIDS的公司包括Adobe、沃尔玛和AstraZeneca。

其中，沃尔玛使用CPU模型无法做大每晚在固定窗口中处理足够的数据来预测有多少易腐烂的商品运送到他们的商店——这一决定可能会产生重大的财务影响。因此，为了适应时间窗口，沃尔玛的数据科学家牺牲了他们的模型质量。

这种方法行不通，因此沃尔玛成为RAPIDS的首批用户之一。结果，沃尔玛利用RAPIDS将特征工程速度提高了100倍，模型训练速度提高了20倍。

Zedlewski告诉我，他从大型合作伙伴那里听说，当他们尝试在模型中集成图形特征的实验方法或者是在必须提供数据时集成图形分析步骤时，这会提高模型的准确性，特别是对于欺诈和网络来说。

对于这样的挑战，RAPIDS cuGraph可以进行现代图形分析所需的预处理、后处理和传统算法。在此过程中，它可以支持数万亿个以上的边缘图，所有这些都可以与熟悉的应用编程接口配合使用，发生速度比CPU快85倍。

RAPIDS RAFT加速器可以解决一个具有挑战性的问题——筛选数亿甚至十亿的内容，可能是一个产品、一张图像或者一段文本——并建立在最近邻和接近于最近邻方法的基础上，使得吞吐量提高10倍，构建时间提高33倍，让过去需要消耗大量服务器的事情现在可以用一台机器即可快速完成。

关于Nvidia RAPIDS是否与超以太网联盟进行了集成（该联盟有望比InfiniBand更好地加速计算和人工智能），Nvidia方面表示：“我们都认为以太网需要在AI时代取得发展，而我们的Quantum和Spectrum-X端到端平台已经体现出这些AI计算结构的优点，这些平台将继续发展，我们将支持可能出现的新标准。”

话虽如此，网络供应商几十年来一直在尝试取代InfiniBand，但仍然无法取代以太网来实现高性能工作负载。Nvidia一直致力于为客户提供最好的服务，因此如果超以太网确实兑现了承诺，相信Nvidia一定会提供支持的，在此之前，久经考验的InfiniBand还将存在下去。

如今我们几乎每天都看到快速的发展，但重要的是要记住，我们正迎来加速计算的黎明，这有点像1994年的Web，我们看看未来30年我们会走向何方吧。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

Nvidia分析师简报会：Nvidia是如何实现加速计算的

来源：至顶网计算频道

2023

07/26

15:14

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

NVIDIA Blackwell 现已在云端全面可用

专访DeepMind CEO：我们距离实现AGI只需5-10年

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: