计算机图形芯片制造商Nvidia公布第一季度业务超出预期,使其股价在盘后交易中上涨近6%。但在Nvidia警告称其主要的游戏和数据中心业务仍面临挑战之后,大部分收益都被抹平了。
该季度,Nvidia在股票报酬等特定成本之前的收益为每股88美分,收入为22.2亿美元,低于去年同期的32.1亿美元,但这仍然好于华尔街预期的每股收益79美分,收入22亿美元。
该季度的表现要比看上去的好一些,因为Nvidia高管提到挑战实际上已经在这个季度开始产生影响了。
例如,Nvidia主要的GPU业务收入下降27%至20.2亿美元,主要是由于游戏和数据中心业务的收入下滑,以及与加密货币采矿处理器相关的损失。
Nvidia游戏业务(GPU部门的主要部分来源)收入同比下滑39%,仅为10.6亿美元,但销售额环比增长了11%。Nvidia表示,环比增长反映了近期游戏GPU销售的增长。
这一增长对Nvidia来说非常重要,因为尽管Nvidia积极推进在人工智能、数据中心和自动驾驶汽车等新增长领域的发展,但视频游戏图形芯片仍然是Nvidia迄今为止最大的业务板块。
“我认为中国市场已经稳定下来,” Nvidia公司首席执行官黄仁勋在电话会议上谈到了这个最大的市场。“中国的游戏市场非常活跃,而且仍然充满活力。”
Nvidia预计下一季度游戏收入将超过25.5亿美元,高于分析师预期的25.3亿美元。
然而,数据中心销售情况令人失望,收入同比下滑10%,仅为6.34亿美元。Nividia首席财务官Colette Kress在电话会议中向投资者警告称:“第二季度全球数据中心支出暂停的情况仍将继续,且可见性仍然很低。”
Kress进一步提醒说,这对Nvidia的游戏业务提出了挑战。“CPU短缺的问题虽然有所改善,但会对我们笔记本电脑业务的复苏造成影响。”
在她发表了这些评论之后,Nvidia股票收益大幅缩水,在截止发稿时仅上涨了2%。
Moor Insights&Strategy分析师Patrick Moorhead认为,数据中心业务受阻只是暂时性的。
Moorhead表示:“我相信这个影响是很大的,Nvidia希望数据中心业务在该财年下半年步入正轨,客户采购更多的训练解决方案。英特尔也面临类似的情况,我认为这是有原因的。”
Constellation Research分析师Holger Mueller表示,如果要恢复增长,那么今年晚些时候数据中心销售额能否提升对于Nvidia来说就是非常关键的了。
Mueller表示:“Nvidia依然能够实现盈利并且扩大研发支出,这一点令人印象深刻。但未来增长的关键,是说服基础设施即服务提供商采购更多的Nvidia产品来运行和驱动基于人工智能的下一代应用。”
然而这并不容易,因为Nvidia面临来自AWS和Google Cloud的强劲挑战,Mueller认为。
“Nvidia需要游说开发者和企业高管使用Nvidia的硬件,并推动公有云基础设施厂商对Nvidia架构的需求增长。”
此外,Nvidia新兴的汽车业务收入为1.66亿美元,专业可视化业务收入为2.66亿美元。
刚刚结束的这个季度对于Nvidia来说是一个繁忙的季度,特别是Nvidia试图以69亿美元的价格收购数据中心网络专业公司Mellanox。有分析师认为,这次收购完全是为了提升Nvidia在计算机图形、数据科学和人工智能领域的地位。
黄仁勋表示:“尽管超大规模数据中心客户的需求短期暂停,但人工智能应用仍在继续加速,我们对即将收购Mellanox感到兴奋,这将有助于我们推动面向高性能计算的数据中心架构,以及从云到边缘的人工智能。”
Nvidia预计第二季度收入为25.5亿美元,上下浮动2%,略高于市场预期的25.4亿美元。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。