GPU制造商Nvidia(英伟达)日前在数据中心业务出人意料放缓的情况下推出一项新的合作伙伴网络计划。新计划可以令企业更容易地利用Nvidia的DGX系统。可用DGX的新数据中心计划已准备就绪(https://www.nvidia.com/en-us/data-center/colocation-partners/),企业可以通过新的Nvidia托管合作伙伴资格网络访问数据中心服务。
GPU加速计算对于那些想要部署AI(人工智能)工作负载的企业是非常有用的。Nvidia在声明里指出,各行各业都有些机构(从医疗保健到石油和天然气业务)成功部署了自己的基于DGX系统的AI数据中心。但也有许多机构并不拥有可以支持加速计算操作的现代数据中心设施。
现在这些机构可以去找一个Nvidia托管合作伙伴,而无需自己折腾自身设施的升级。他们可以通过新计划部署DGX系统或最近发布的DDN、IBM Storage、NetApp和Pure Storage的DGX参考架构解决方案。
Nvidia前一阵披露了第四季度的业绩未达预期的消息,几天后就推出了旗下数据中心新计划。 Nvidia表示,“客户趋向于更加谨慎,Nvidia之前预测的一些交易在本季度的最后一个月未能完成。”另外,游戏需求低于预期, 导致了Nvidia下调公司第四季度指引。
Nvidia新计划的合作伙伴网络目前含九家北美数据中心运营商,包括Aligned Energy、Colovore、Core Scientific、CyrusOne、Digital Reality、EdgeConneX、Flexential、Scale Matrix和Switch。 Nvidia正评估北美的其他的计划合作伙伴,并计划在今年晚些时候在全球推广该计划。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。