Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai

Nvidia今天透露，已经收购了Run:ai，一家开发优化显卡集群性能软件的初创公司。

此次收购交易的条款并未披露。TechCrunch援引两位知情人士的话报道称，此次交易对Run:ai的估值为7亿美金，这几乎是这家总部位于特拉维夫的初创公司在收购之前筹集的资金金额的6倍。

Run:ai的正式名称为Runai Labs Ltd，提供的软件主要用于加速配备了GPU的服务器集群。据该公司称，由其技术支持的GPU环境可以运行的AI工作负载比其他方式要多出10倍，而且它是通过修复几个经常影响GPU驱动的服务器的常见处理效率低下问题来提高AI性能的。

Run:ai解决的第一个问题，源于AI模型通常使用多个显卡进行训练。为了将神经网络分布在GPU集群上，开发人员会将其分成多个软件片段，并在不同的芯片上训练每个片段。这些AI片段必须在训练过程中定期相互交换数据，这可能会导致性能问题。

如果AI片段必须与当前未运行的神经网络的不同部分交换数据，则必须暂停处理，直到后一个模块上线，由此产生的延迟会减慢AI训练的工作流程。Run:ai可以确保促进数据交换所需的所有AI片段同时在线，从而消除不必要的处理延迟。

Run:ai的软件还避免了所谓的内存冲突。在这种情况下，两个AI工作负载会尝试同时使用GPU内存的同一部分。GPU会自动解决此类错误，但故障排除过程需要时间。在AI训练过程中，修复内存冲突所花费的时间会显着增加并减慢处理速度。

在同一GPU集群上运行多个AI工作负载还可能导致其他类型的瓶颈。如果其中一个工作负载需要的硬件超出预期，那么它可能会使用分配给其他应用的基础设施资源并放慢这些应用的速度。Run:ai提供的功能可以确保每个AI模型都获得足够的硬件资源，在没有延迟的情况下完成分配的任务。

Nvidia副总裁、DGX云部门总经理Alexis Bjorlin在一篇博客文章中详细介绍了这一点，他说：“该公司在Kubernetes上构建了一个开放平台，这是现代AI和云基础设施的编排层，支持所有主流的Kubernetes变体，并与第三方AI工具和框架进行了集成。”

Run:ai主要销售核心基础设施优化的平台以及其他两种软件工具。首先是Run:ai Scheduler，它提供了一个为开发团队和AI项目分配硬件资源的接口，其次是Run:ai Dev，可以帮助工程师更快地设置用于训练神经网络的编码工具。

Nvidia已经在自己的多款产品中附带了Run:ai的软件，包括Nvidia Enterprise，是Nvidia为自己数据中心GPU提供的一套开发工具，以及DGX系列AI优化型设备。Run:ai也可在DGX Cloud上使用，并且通过该产品，企业可以访问主流公有云中的Nvidia AI设备。

Bjorlin表示，“在可预见的未来”，Nvidia将继续在当前定价模式下提供Run:ai的工具，与此同时，Nvidia将发布该软件的增强功能，重点关注有助于优化DGX云环境的功能。

Bjorlin详细介绍道：“客户可以期望他们将受益于更好的GPU利用率、改进的GPU基础设施管理以及开放架构带来的更高灵活性。”

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai

来源：至顶网计算频道

2024

04/25

09:38

分享

点赞

联想问天 WR5220 G5服务器

联想问天 WA7880a G3服务器

苹果注重隐私的年龄验证方案可解决两大难题

Cursor通过收购Graphite继续扩张之路

ChatGPT新增个性化设置功能，用户可自定义聊天体验

Kuxiu S3固态电池充电宝替代多款充电器的全能解决方案

Waymo自动驾驶出租车遭遇交通灯故障停摆事件分析

智启未来，共筑开发者生态 AMD携手DataWhale、魔搭社区，共建ROCm开发者生态

千问C端事业群成立后首推平价AI眼镜：低至1999元，搭载千问AI助手

Aqara Hub M200为HomeKit带来Matter支持和新自动化选项

LG智能电视强制安装Copilot快捷方式引发用户不满

Palo Alto Networks与谷歌云签署数十亿美元AI合作协议

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

该需要多少 NVIDIA CUDA Cores ？

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

RTX5090震撼发布，一文带你看懂英伟达CES2025发布会。

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: