1月19日,NVIDIA CEO黄仁勋抵达北京,参加NVIDIA的答谢迎春会,并发表了致辞。
60年后,我们正在重新定义计算机
在谈到人工智能时,黄仁勋提到,60年前,人类发明了今天的计算机,它使用通用计算,可以对运行在CPU上的程序指令进行编码。现代计算机的计算模型则是在1962年被提出的。但自从IBM推出IBM System 360的那一年,计算机就没有重大突破了。“然而,人工智能是一项计算机停滞了60多年后的重大技术突破,60年后的今天,我们正在重新发明计算机。”黄仁勋说。
黄仁勋指出:“如今的计算机不再需要编码,而是机器学习,它创造的软件也不是软件程序,而是人工智能。由这些构建出的计算机是一种新型的计算机。”
如果将“老黄”提到的转变,理解为一种“计算机的重生”。那么过去的计算机,是人类意志的延伸,是工具;而未来的计算机,则更像是一个能够自我演化的生命体。它们不再需要人类的“编码”,而是通过“机器学习”来获得能力,这类似于生物的进化过程。这种进化,并非完全随机,而是基于数据和算法的“自然选择”,最终涌现出具备复杂智能的机器。
黄仁勋展望道:“现在,人工智能正处于新的起点,这是计算领域的新开端。” 这一态度展现了黄仁勋对人工智能未来的信心,也突显了NVIDIA在推动技术进步与全球市场发展中的重要角色。
重视中国市场 中国员工离职率全球最低
对于市场方面,黄仁勋谈到,过去的二十年来,NVIDIA携手合作伙伴推动了全球多个重要市场的现代化,尤其是在中国市场。他表示:“我们为世界最重要市场之一和伟大的国家贡献了力量。” 现在,借助人工智能,NVIDIA能够继续为许多具有挑战性的问题提供创新的解决方案。
事实上,黄仁勋曾在多个场合强调中国市场的重要性。公开信息提到,NVIDIA也是近年来中国为数不多的仍在持续扩张招聘的外资企业。NVIDIA 2025财年第三季度的财报中显示,在2024年10月结束的季度中,NVIDIA在包括香港在内的中国市场利润为54亿美元。
对于NVIDIA中国的员工而言,黄仁勋自豪地提到,NVIDIA进入中国已经长达25年,在北京、上海、深圳三地拥有近4000名员工,而且NVIDIA中国员工的流失率是全球最低的,每年离职率只有0.9%。这意味着,NVIDIA中国员工每年只有35人左右离职,平均每百人还不到一人。
黄仁勋曾公开表示,他相信每个员工都会进步,等他们开窍时,属于他们的伟大时刻也就到了。
据NVIDIA员工透露,尽管工作压力有时较大,但能够在人工智能这一尖端技术领域工作,并且获得与之相匹配的薪酬,是他们选择留在NVIDIA的主要原因。这也侧面证明了,1月13日领英上的风险投资人Ruben D透露的消息——“NVIDIA 78%的员工已成为百万美元富翁”的信息。
事实上,NVIDIA低离职率的背后,展现出个体与时代、企业与员工相互成就的深刻图景。长期耕耘奠定稳固基石,极低离职率折射出内在驱动力与归属感的高度统一,对员工潜力的信任则蕴含着对“时机”的察,而尖端领域的工作与优渥的回报,则构成“价值”与“实现”的完美闭环。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。