NVIDIA针对大规模数据分析和机器学习推出RAPIDS开源GPU加速平台

NVIDIA发布了一款针对数据科学和机器学习的GPU加速平台，该平台已为多个行业领先者所采用，并能帮助超大规模公司以前所未有的速度分析海量数据并进行精准的业务预测。

HPE、IBM、Oracle、开源社区、创业公司采用RAPIDS，显著提升端到端预测数据分析能力

德国慕尼黑—GTC Europe—2018年10月10日—NVIDIA发布了一款针对数据科学和机器学习的GPU加速平台，该平台已为多个行业领先者所采用，并能帮助超大规模公司以前所未有的速度分析海量数据并进行精准的业务预测。

RAPIDS开源软件帮助数据科学家显著地提高了工作绩效，对于这些数据科学家来说，种种业务挑战应接不暇，其中包括预估信用卡诈骗、预测零售存货及理解顾客购买行为等等。众多公司——无论是Databricks和Anaconda等开源社区先驱还是Hewlett Packard Enterprise、IBM和Oracle等技术领袖——在GPU对数据分析的重要性方面日益达成共识，并对RAPIDS表现出越来越多的支持。

据分析师估计，面向数据科学和机器学习的服务器市场每年价值约为200亿美元，加上科学分析和深度学习市场，高性能计算市场总价值大约为360亿美元。

“数据分析和机器学习是高性能计算市场中最大的细分市场，不过目前尚未实现加速，“NVIDIA创始人兼首席执行官黄仁勋在GPU技术大会主旨演讲中发布RAPIDS时表示，”全球最大的行业均在海量服务器上运行机器学习算法，目的在于了解所在市场和环境中的复杂模式，同时迅速、精准地做出将直接影响其决策的预测。

黄仁勋表示，“得益于CUDA及其全球生态系统以及与开源社区紧密合作，我们已创建了RAPIDS GPU加速平台。该平台已与全球最流行的数据科学库及工作流无缝整合，可加速机器学习。如同深度学习一样，我们正在不断地为机器学习提速。”

RAPIDS已为GPU加速分析和机器学习提供了一整套开源库，数据可视化即将是下一个目标。RAPIDS由NVIDIA工程师与主要的开源贡献者在过去两年的合作成果。

RAPIDS第一次为数据科学家提供了他们需要用来在GPU上运行整个数据科学管线的工具。最初的RAPIDS基准分析利用了XGBoost机器学习算法在NVIDIA DGX-2系统上进行训练，结果表明，与仅有CPU的系统相比，其速度能加快50倍。这可帮助数据科学家将典型训练时间从数天减少到数小时，或者从数小时减少到数分钟，具体取决于其数据集的规模。

与开源社区开展紧密合作

RAPIDS构建于Apache Arrow、pandas和scikit-learn等流行的开源项目之上，为最流行的Python数据科学工具链带来了GPU提速。为了将更多的机器学习库和功能引入RAPIDS，NVIDIA广泛地与开源生态系统贡献者展开合作，其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs负责人兼Apache Arrow缔造者Wes McKinney以及迅速增长的Python数据科学库pandas等等。

McKinney表示，“作为GPU加速的数据科学平台，RAPIDS是由Apache Arrow驱动的新一代的计算生态系统。NVIDIA与Ursa Labs的合作将加速Arrow核心数据库的创新步伐，并有助于大幅提升分析及特征工程的绩效。”

为了推动RAPIDS的广泛应用，NVIDIA正努力将RAPIDS与Apache Spark进行整合，后者是分析及数据科学方面领先的开源框架。

Databricks联合创始人、首席技术官兼Apache Spark创始人Matei Zaharia表示，“在Databricks公司中，我们对RAPIDS在加速Apache Spark工作量方面的潜力感到非常兴奋。我们目前开展的多个项目都意在将Spark更好地与本地加速器进行整合，其中包括借助Project Hydrogen实现的Apache Arrow的支持以及GPU调度。我们相信，就扩大我们客户数据科学及AI工作量来说，RAPIDS将是全新的、振奋人心的机会。”

广泛的生态系统支持及应用

各个行业技术领先的企业均是NVIDIA GPU加速平台及RAPIDS的率先应用者。

沃尔玛执行副总裁兼首席技术官Jeremy King表示，“NVIDIA的GPU加速平台及RAPIDS软件极大改进了我们使用数据的方式，帮助我们实现了复杂模式大规模地运行，同时进行更加精准的预测。RAPIDS的应用得益于NVIDIA和沃尔玛工程师之间的深度合作，我们准备继续推进这种合作关系。”

此外，一些全球领先的技术公司也力图通过全新的系统、数据科学平台和软件解决方案支持RAPIDS，包括Cisco、DELL EMC、联想、NERSC、NetApp、Pure Storage、SAP和SAS等。

供货

全套RAPIDS开源库现在即可在http://www.rapids.ai上获得，代码经Apache许可公布。容器化RAPIDS版本现在即可在NVIDIA GPU Cloud container registry上获得。

来源：业界供稿

0赞

好文章，需要你的鼓励

NVIDIA针对大规模数据分析和机器学习推出RAPIDS开源GPU加速平台

与开源社区开展紧密合作

广泛的生态系统支持及应用

来源：业界供稿

2018

10/15

09:51

分享

点赞

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

多站点IT基础设施升级指南：告别VMware的替代方案

戴尔集成Elasticsearch与英伟达Blackwell GPU升级AI数据平台

Confluent Cloud为智能体提供实时数据流处理能力

数字化转型失败的6个警示信号

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

AI 竞争加剧，GPT-4.5 发布：数据效率成为关键

为帮助 AI 理解世界，研究人员将其装入机器人

从 2.2 亿数据点到营收：AI 如何改变体育娱乐的投资回报

AI 研究显示：部分员工已过度依赖 AI 思考

Hugging Face 计划对 DeepSeek 的 R1 推理模型进行逆向工程

NVIDIA Blackwell 现已在云端全面可用

瑞典委员会提出推动人工智能改革路线图

AI 投资回报率难以说服 IT 决策者

谷歌 AI 为"自愈"路坑铺平道路

别让生成式 AI 在你脑中白住

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: