掘金数据科学市场 NVIDIA RAPIDS通过GPU加速价值实现原创

作者：李祥敬

NVIDIA解决方案架构与工程团队副总裁Marc Hamilton告诉记者，数据科学在2010年变得非常兴盛，但是那个时候CPU的计算力已经没办法满足数据科学家的需求了。

至顶网服务器频道 12月04日新闻消息（文/李祥敬）：在这个数据无处不在的时代，如何从数据中获取价值成为企业的重要课题。有数据显示，面向数据科学和机器学习的服务器市场每年价值约为200亿美元，加上科学分析和深度学习市场，高性能计算市场总价值大约为360亿美元，且该市场还在持续快速发展。

在NVIDIA看来，数据分析和机器学习是高性能计算市场中最大的细分市场，不过目前尚未实现加速。NVIDIA解决方案架构与工程团队副总裁Marc Hamilton告诉记者，数据科学在2010年变得非常兴盛，但是那个时候CPU的计算力已经没办法满足数据科学家的需求了。数据规模越来越大，但是计算力并没有相应发展，等待时间也是越来越长。于是，NVIDIA推出了开源GPU加速平台——RAPIDS，为数据科学家提供标准化的流水线式工具。

在当前的人工智能浪潮中，深度学习与机器学习是两个重要的技术。在Marc看来，深度学习在处理非结构化数据（比如语音、图像等）上的效果更好，而机器学习却在结构化数据处理上效果更好。RAPIDS把深度学习的能力扩展到了大数据领域。

也就是说，RAPIDS把GPU最为擅长的深度学习优势也带到了机器学习领域，让企业在处理结构化数据方面与在处理非结构化数据方面同样获得GPU的加速。据悉，最初的RAPIDS基准分析利用了XGBoost机器学习算法在NVIDIA DGX-2系统上进行训练，结果表明，与仅有CPU的系统相比，其速度能加快50倍。这可帮助数据科学家将典型训练时间从数天减少到数小时，或者从数小时减少到数分钟。

RAPIDS平台通过加速cuDF、cuML、cuGRAPH库，英伟达能够让GPU加速计算应用到更多机器学习的算法与场景当中，为数据科学家提供标准化的流水线式工具。比如在数据处理方面，RAPIDS将会通过数据准备、数据合并、数据降维三个步骤加速处理数据。

Marc表示，RAPIDS底层由CUDA支撑。他强调，RAPIDS加速有不同方式，一种方式是在CUDA上对软件进行重新编程，第二种方式是使用CUDA软件库、cuML及机器学习的软件库，用来加速XGBOOST。第三种加速方式是在软件应用层面的加速，比如：SAP或者Oracle的某些软件功能已经可以通过GPU加速。

RAPIDS采用了开源的方式，可以非常完美地运行在GPU云平台，数据科学家只需要下载RAPIDS代码，就可以使用机器学习，不需要对现有代码进行太多修改。而且RAPIDS会保持不断更新，用户也可以将自己的需求反馈给NVIDIA，新的功能会不断加入到新版本中，满足用户的需求。

目前英伟达正在广泛地与开源生态系统贡献者展开合作，其中包括Anaconda、BlazingDB、Databricks、Quansight等，将更多的机器学习库和功能引入RAPIDS。为了推动RAPIDS的广泛应用，英伟达正努力将RAPIDS与分析及数据科学方面领先的开源框架Apache Spark进行整合。

在落地应用方面，RAPIDS目前已经被非常广泛采用，比如华大基因、中国移动、平安科技等中国公司都宣布引入它进行机器学习加速。例如，平安科技使用RAPIDS以及GPU加速的PCA和DBSCAN之后，工作流程执行速度加快了80倍，从几天缩短到几小时（包括数据加载和训练时间），这有助于该公司主动做出预测并完善预防计划。

华大基因使用XGBoost机器学习算法，对用于癌症患者个性化免疫治疗的靶向多肽进行分类。他们在NVIDIA DGX-1 AI超级计算机上运行RAPIDS平台，将分析速度提高了17倍，并将多肽的分析范围扩大至数百万种。

来源：至顶网服务器频道

0赞

好文章，需要你的鼓励

掘金数据科学市场 NVIDIA RAPIDS通过GPU加速价值实现 原创

来源：至顶网服务器频道

2018

12/04

14:23

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

该需要多少 NVIDIA CUDA Cores ？

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

RTX5090震撼发布，一文带你看懂英伟达CES2025发布会。

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

掘金数据科学市场 NVIDIA RAPIDS通过GPU加速价值实现原创