如今无论所见何处,数据密集型应用都在以惊人的速度增长着,而Nvidia是身处于这一发展趋势核心的公司之一,最近,Nvidia因其生产的AI芯片而一路走高。

前不久Nvidia举办了一场分析师简报会,Nvidia公司数据科学工程高级总监John Zedlewski介绍了Nvidia是如何实现加速计算,本文包含了对这次简报会的一些观点。
几十年前,Nvidia就处于加速计算的基础层上,那个时候Nvidia取得了很大的进步,并且在过去的一两年里速度大大加快。谈到系统架构,John提出了一个有趣的观点。
他说:“所有这些硬件都很棒,尽管有时候有些奇特,但如果没有软件来运行硬件的话,就不会取得成功。我们希望让开发人员能够轻松地从这个极其复杂的硬件中获得最大性能,并让这样的性能轻松融入到您的应用领域。”
Zedlewski指出,Nvidia将产品打包在Nvidia AI等平台和端到端框架中,例如用于大型语言模型的Nemo和用于医学成像的Monet。大多数人认为,Nvidia是一家GPU制造商,尽管Nvidia在这个领域可以说是一流的企业,但它的系统方法领先于竞争对手英特尔和AMD。
Nvidia将GPU与软件开发套件、加速库、系统软件和硬件打包在一起,形成端到端的解决方案,这简化了使用Nvidia技术的过程,几乎变得“即插即用”。
他补充说,在训练大型语言模型之前,首先要确定所需的数据集(甚至可能与互联网上的所有文本一样广泛),这会带来大量数据科学和数据管理方面的问题。
他说:“如果你想有效地做到这一点,如果你希望能够迭代、细化和改进你的数据,你就需要一种加速它的方法,这样你就不必为每次迭代而等待数月了。我们总是从预测合作伙伴那里听到这样的说法。他们说,‘看,我们的遗留系统非常擅长每月和每周的预测。’”
这些合作伙伴需要一种方法来构建模型并且更快地运行这些模型以便进行预测,而不是每月、每周、甚至是每天,他们需要做到实时。速度在欺诈检测、基因组学和网络安全等其他应用中也是至关重要的,这些应用必须随着事件的展开而分析大量数据集。数据科学家使用的工具无法满足梳理大量数据存储的需求。
Nvidia的Triton是一个专门用于深度学习推理的开源推理平台,经过增强之后可以支持数据科学家和机器学习工程师仍在整个行业构建的许多基于树的模型。
Zedlewski表示:“我们越来越多地看到人们对包含矢量搜索的部署框架很感兴趣,无论是具有矢量搜索组件、图像搜索还是推荐系统的大型语言模型,所以我们还有RAPIDS Raft的矢量搜索加速器。”
Nvidia让数据科学家们能够轻松处理具有数亿行的数据集。而且Nvidia还认识到,没有一种工具可以包揽一切,因此Nvidia拥有100多个开源和商业软件集成。Zedlewski表示,这些集成是为了使各项工作顺利无缝地展开,从而让构建复杂的多组件管道变得更加简单。
Nvidia的GitHub开源项目有350名贡献者。Zedlewski表示,有超过25%的财富500强企业在使用RAPIDS,企业采用率还在不断上升。使用RAPIDS的公司包括Adobe、沃尔玛和AstraZeneca。
其中,沃尔玛使用CPU模型无法做大每晚在固定窗口中处理足够的数据来预测有多少易腐烂的商品运送到他们的商店——这一决定可能会产生重大的财务影响。因此,为了适应时间窗口,沃尔玛的数据科学家牺牲了他们的模型质量。
这种方法行不通,因此沃尔玛成为RAPIDS的首批用户之一。结果,沃尔玛利用RAPIDS将特征工程速度提高了100倍,模型训练速度提高了20倍。
Zedlewski告诉我,他从大型合作伙伴那里听说,当他们尝试在模型中集成图形特征的实验方法或者是在必须提供数据时集成图形分析步骤时,这会提高模型的准确性,特别是对于欺诈和网络来说。
对于这样的挑战,RAPIDS cuGraph可以进行现代图形分析所需的预处理、后处理和传统算法。在此过程中,它可以支持数万亿个以上的边缘图,所有这些都可以与熟悉的应用编程接口配合使用,发生速度比CPU快85倍。
RAPIDS RAFT加速器可以解决一个具有挑战性的问题——筛选数亿甚至十亿的内容,可能是一个产品、一张图像或者一段文本——并建立在最近邻和接近于最近邻方法的基础上,使得吞吐量提高10倍,构建时间提高33倍,让过去需要消耗大量服务器的事情现在可以用一台机器即可快速完成。
关于Nvidia RAPIDS是否与超以太网联盟进行了集成(该联盟有望比InfiniBand更好地加速计算和人工智能),Nvidia方面表示:“我们都认为以太网需要在AI时代取得发展,而我们的Quantum和Spectrum-X端到端平台已经体现出这些AI计算结构的优点,这些平台将继续发展,我们将支持可能出现的新标准。”
话虽如此,网络供应商几十年来一直在尝试取代InfiniBand,但仍然无法取代以太网来实现高性能工作负载。Nvidia一直致力于为客户提供最好的服务,因此如果超以太网确实兑现了承诺,相信Nvidia一定会提供支持的,在此之前,久经考验的InfiniBand还将存在下去。
如今我们几乎每天都看到快速的发展,但重要的是要记住,我们正迎来加速计算的黎明,这有点像1994年的Web,我们看看未来30年我们会走向何方吧。
好文章,需要你的鼓励
VSCO今日更新VSCO Capture应用,新增视频拍摄功能。用户现可在拍摄照片和视频时应用并调整VSCO的50多种滤镜预设,包括经典胶片到现代创作风格。新版本还推出胶片颗粒滤镜,可动态控制纹理强度、大小和色彩。用户能将颗粒滤镜叠加到Film X滤镜上,结合柯达、富士和爱克发胶片风格,保存个性化胶片配方。
瑞士ETH苏黎世联邦理工学院等机构联合开发的WUSH技术,首次从数学理论层面推导出AI大模型量化压缩的最优解。该技术能根据数据特征自适应调整压缩策略,相比传统方法减少60-70%的压缩损失,实现接近零损失的模型压缩,为大模型在普通设备上的高效部署开辟了新路径。
Instagram负责人Adam Mosseri表示,AI生成内容已经占据社交媒体主导地位,预计将超越非AI内容。他认为识别AI内容的技术效果不佳,建议转而为真实媒体建立指纹识别系统,由相机制造商在拍摄时进行加密签名。Mosseri还指出,创作者应优先发布"不完美"的原始图像来证明真实性,因为精美方形图片的时代已经结束。
弗吉尼亚大学团队创建了Refer360数据集,这是首个大规模记录真实环境中人机多模态交互的数据库,涵盖室内外场景,包含1400万交互样本。同时开发的MuRes智能模块能让机器人像人类一样理解语言、手势和眼神的组合信息,显著提升了现有AI模型的理解准确度,为未来智能机器人的广泛应用奠定了重要基础。