Nvidia今天宣布已经达成协议,将以69亿美元的价格收购数据中心网络专业厂商Mellanox Technologies,为最近关于Nvidia收购计划的传闻画上了句号。
这次全现金交易是迄今为止Nvidia规模最大的一笔交易。69亿美元的报价拆分为Mellanox股票每股125美元,比周五收盘价高出14%。
这是一个明显的溢价,特别是考虑到在10月收购传闻浮出水面之后Mellanox的股价上涨了66%。今天Mellanox股价上涨超过8%,至每股118.50美元左右。Nvidia投资者也非常乐意听到这个消息,Nvidia股价在今天的交易中涨幅超过7%。
据报道,英特尔和赛灵思(Xilinx)等芯片制造商也曾试图收购总部位于以色列的Mellanox。Mellanox主要为数据中心网络系统开发专用处理器,此外还提供各种相关产品,从交换机到用于连接服务器和存储的线缆。
Mellanox的客户中包括主要的数据中心硬件制造商(如戴尔)和多家基础设施即服务提供商。微软也在自己的Azure云平台上使用Mellanox的网络产品,并且曾一度成为Mellanox的潜在买家。
Mellanox在高性能计算领域也拥有重要影响力,全球500强超级计算机中有一半以上采用了Mellanox的产品,其中包括前两大超计算机——由美国能源部运营的Sierra和Summit,而且这两套系统也采用了Nvidia GPU。
Mellanox所在的三个市场——企业数据中心、公有云和超级计算——也都是Nvidia的重点关注领域。这次收购可以为Nvidia在这些领域的增长提供重要推动力。
Moor Insights&Strategy总裁兼首席分析师Patrick Moorhead表示:“Nvidia收购Mellanox应该是两家公司之间的协同举措。Nvidia和Mellanox都在高性能计算、机器学习、汽车、公有云和企业数据中心市场都有重要的地位,双方的结合可以为客户带来更多价值。”
Nvidia首席执行官黄仁勋在今天上午的新闻发布会上,阐述了他对这次收购的看法。他说:“这背后的策略基本上是就是加速数据中心,通过人工智能、数据分析和数据科学,将像构建高性能计算机一样构建数据中心。”
黄仁勋补充说:“数据中心将成为一个巨大的计算引擎。计算将扩展到网络,网络本身将成为计算结构的一部分。”他认为,Mellanox在实现这一新模型方面将发挥重要的作用,因为“这些计算机协同工作所需的连接性正在变得越来越强大和越来越重要”。
69亿美元的收购价格背后的另一个因素是,Mellanox将为Nvidia带来重要的收入增长来源。Mellanox借助以太网业务的强劲表现,在2018年的收入增长了26%,超过10亿美元。市场对Mellanox以太网交换机的需求同比增长70%,而且Mellanox预计2019年这一增长还将继续加速。
英特尔对Mellanox的收购企图也可能是促使Nvidia提出如此慷慨要约的原因之一。英特尔是Nvidia的主要竞争对手之一,正在积极致力于扩大在数据中心连接业务中的影响力。就在今天早上,英特尔推出了一项新技术,用于将GPU等加速器芯片与服务器CPU连接起来。
Nvidia预计此次收购将在年底前完成。在新闻发布会上黄仁勋表示:“我们的商业模式不会改变”,即使是将业务范围从GPU扩展到成为他所谓的系统架构公司。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。