作者:DYLAN MARTIN
更新时间:美国东部时间2024年7月17日下午4:15
最新被英伟达收入囊中的初创公司Brev.dev可以帮助AI开发人员在云供应商中找到最具成本效益的GPU计算。在此之前,英伟达还收购了另外两家初创公司,目的很明确,就是为了扩展其 DGX Cloud 服务的功能。
英伟达刚刚收购了一家帮助AI开发人员在云服务提供商中寻找最具成本效益的GPU计算的初创公司,这也是这家AI芯片巨头今年的第四次收购。
英伟达的一位发言人周二向CRN证实该公司收购了Brev.dev,后者是一家旧金山的初创公司,提供AI和机器学习开发平台,可以在基于CPU和GPU的云实例上构建、训练和部署模型。
这笔收购的具体财务细节没有披露。
这家初创公司本周在LinkedIn上表示:“Brev的目标是为AI/ML开发人员构建使用GPU的最简单方法,”“与英伟达合作意味着能够将最强大的硬件与业界领先的软件结合在一起,以实现这一使命。”
Brev.dev在其网站上将英伟达、英特尔和AWS列为官方合作伙伴,并表示其平台是“AWS、谷歌云平台、Fluidstack和其他GPU云之间的单一接口。”这家初创公司表示,这可以让开发人员根据成本和可用性找到实例。
十多年来,英伟达一直在为云服务提供商提供 GPU,但近年来,该公司一直在寻求通过不断扩充的软件和服务组合,围绕云基础设施(人工智能开发的热点)开展更大规模的业务。
最值得注意的是,该公司去年推出了DGX Cloud,这是一项运行在 AWS等云服务提供商之上的服务,可让企业快速获得创建和运行生成式人工智能应用所需的工具、支持和 GPU 驱动的基础设施。该服务的起步价为每月19,699美元,并需要承诺使用一个基于A100 的节点一年。
英伟达今年早些时候进行的两起收购都明确是为了增强其 DGX Cloud 服务的能力。
4月底,英伟达宣布收购以色列人工智能基础设施管理初创公司Run:ai。这家初创公司提供基于Kubernetes的工作负载管理和编排软件,英伟达表示计划利用该软件推动其DGX Cloud业务,并增强 DGX和HGX服务器客户的能力。
多份报告称,收购Run:ai的估值约为7亿美元。
本月早些时候,英伟达收购了Shoreline.io,这是一家位于加州红木城的初创公司,由AWS前高管创立,提供自动修复数据中心基础设施问题的软件。该交易得到了这家初创公司的确认,其一位投资者表示,Shoreline的团队将加入DGX Cloud部门。据报道,这笔交易的估值约为1亿美元。
英伟达今年进行的另一项收购是另一家名为Deci的以色列初创公司,该公司生产的软件可以加快人工智能模型的推理速度,同时在任何硬件上都能保持准确性。据报道,这笔交易的估值约为3亿美元。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。