据报道,计算机图形芯片制造商Nvidia赢得了一场竞购战,收购以色列热门初创公司Mellanox,而这家公司曾吸引了英特尔和微软的关注。
据彭博社和路透社援引“知情人士”的话报道称,Nvidia将以高达70亿美元的价格收购Mellanox。
按照这个价格,这将成为Nvidia有史以来规模最大的一笔收购,让Nvidia在2011年收购Icera所支付的3.67亿美元相形见绌。据报道,Nvidia有意利用Mellanox技术推动其数据中心芯片业务,减少对面向视频游戏行业售卖GPU这一主要业务的依赖。
根据路透社的消息来源称,Nvidia的出价超过了英特尔,可能会在美国时间周一公布这一消息。而英特尔对Mellanox的兴趣最早是在1月首次曝光的。据报道,微软早在去年12月也曾考虑收购Nvidia,但目前尚不清楚微软是否真的提出了要约。据报道,另一家芯片制造商Xilinx也对Nvidia很感兴趣。
如果这一消息得到确认,那么Nvidia将会得到一个相当多元化的初创公司。Mellanox主要销售基于以太网和InfiniBand通信协议的网络硬件,包括用于连接服务器和存储系统的线缆和交换机。
对于Nvidia来说,或许更让它感兴趣的是Mellanox销售的电脑芯片,这主要用于为数据中心网络设备,以及本地数据中心、公有云基础设施和超级计算机。据称,Mellanox在超级计算机市场占据一席之地,全球500强超级计算机中有一半以上采用了Mellanox的网络工具和芯片。
据称,Mellanox的芯片对于加速计算机组件之间的数据传输特别有用,这一点这很重要,因为对于依赖快速洞察为业务决策提供信息的企业来说,分析数据的速度至关重要。
此次收购对于Nvidia来说肯定会带来提振作用。Nvidia目前约有三分之一的收入来自数据中心客户,但由于中国需求放缓,近几周游戏业务受到冲击。此外,Nvidia也受到加密货币挖矿业的打击。在最近的季度财务报告中,由于这些不利因素,Nvidia不得不将收入预期削减了5亿美元。
Moor Insights&Strategy分析师Patrick Moorhead表示,如果这次收购属实,那么将是一次协同收购,因为双方的技术是互补的。“Nvidia和Mellanox在高性能计算、机器学习、汽车、公有云和企业数据中心市场都有重要的地位,并且在[他们的技术]结合起来可以为客户带来更多价值。”
“规模和多样化是芯片业务的一切,Nvidia通过这次收购可两者兼得,”Constellation Research首席分析师兼副总裁Holger Mueller补充道。“这次收购让Nvidia能够在现有的图形、游戏和人工智能业务上实现扩展和多样化。进入数据中心对于整体向公有云的迁移至关重要,因此,如果这一消息属实,就意味着Nvidia对管理人员和开发人员的意义更大了。”
据彭博社报道,Nvidia仍然面对着获得监管部门批准的难题。特别是作为全球最大的芯片生产国和消费国,最近几个月美国与中国之间的贸易战将让这一审批过程变得更加艰难。
例如去年,高通就因为中国监管机构的无期限延迟而取消收购NXP Semiconductor N.V.。几个月后,美国总统特朗普以国家安全为由阻止博通对高通的收购。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。