2025 年 5 月 19 日 ,NVIDIA 在COMPUTEX 上发布以下全新技术:NVIDIA Isaac GR00T N1.5,这是 NVIDIA 首个开源、通用且完全可定制的人形机器人推理与技能基础模型的首次更新;用于合成运动生成的 NVIDIA Isaac GR00T-Dreams Blueprint;以及用于加速人形机器人开发的 NVIDIA Blackwell 系统。
包括 Agility Robotics、波士顿动力、傅利叶、Foxlink、银河通用、Mentee Robotics、NEURA Robotics、General Robotics、Skild AI 和小鹏机器人在内的多家人形机器人和机器人开发商,正采用 NVIDIA Isaac™ 平台技术推动人形机器人的开发与部署。
NVIDIA 创始人兼首席执行官黄仁勋表示:“物理 AI 与机器人技术将开启新一轮工业革命。从机器人的 AI 大脑到用于训练的仿真环境,再到训练基础模型的 AI 超级计算机,NVIDIA 为机器人开发的每个环节提供核心技术支持。”
全新 Isaac GR00T 数据生成 Blueprint 填补数据鸿沟
黄仁勋在 COMPUTEX 主题演讲中展示的 NVIDIA Isaac GR00T-Dreams,为开发者提供生成海量合成运动数据(即神经轨迹)的解决方案。物理 AI 开发者可利用这些数据训练机器人适应动态环境等新行为的能力。
开发者可首先针对其机器人对 Cosmos Predict 世界基础模型(WFM)进行后训练。随后,GR00T-Dreams 仅需单张图像作为输入,即可生成机器人在新环境中执行新任务的视频。该 Blueprint 随后提取动作 tokens(经压缩且易于处理的数据片段),用于教会机器人如何执行这些新任务。
GR00T-Dreams Blueprint 是对今年三月 GTC 大会发布的 Isaac GR00T-Mimic Blueprint 的补充。GR00T-Mimic 使用 NVIDIA Omniverse™ 和 NVIDIA Cosmos™ 平台增强现有数据,而 GR00T-Dreams 则使用 Cosmos 生成全新数据。
全新 Isaac GR00T 模型推动人形机器人开发
NVIDIA 研究院借助 GR00T-Dreams Blueprint 生成合成训练数据,仅用 36 小时就完成了 GR00T N1.5 模型的开发(基于 GR00T N1 更新)。相比之下,如果采用人工数据收集的方式,这一过程需耗时近三个月。
GR00T N1.5 展现出更强的环境适应性与工作空间配置调整能力,并可通过用户指令识别目标物体。此次更新大幅提升了模型在工业物料分拣、存放等常见制造场景中的任务成功率。
当前,AeiRobot、Foxlink、光轮智能与 NEURA Robotics 等企业已率先采用 GR00T N 系列模型。AeiRobot 利用该模型使 ALICE4 机器人能够理解自然语言指令,执行工业场景中的复杂抓取与放置工作流。Foxlink 借助该模型提升工业机械臂的灵活性与作业效率。光轮智能通过模型验证合成数据,加速工厂场景人形机器人部署。NEURA Robotics 正评估模型性能,以加速家庭自动化系统的开发进程。
全新机器人仿真与数据生成框架加速训练流程
开发高技能人形机器人需要海量多样化数据支撑,但真实数据采集与处理成本高昂,且机器人需要在物理世界中进行测试,这也可能带来成本和风险。
为帮助填补数据和测试缺口,NVIDIA 推出以下仿真技术:
Foxconn 与 Foxlink 正在使用 GR00T-Mimic Blueprint 加速其合成运动操作生成,优化工业机器人训练流程。Agility Robotics、波士顿动力、傅利叶、Mentee Robotics、NEURA Robotics、小鹏机器人等正通过 NVIDIA Isaac Sim 与 Isaac Lab 推进人形机器人仿真训练。Skild AI 运用仿真框架开发通用机器人智能系统,General Robotics 则将其集成到自身的机器人智能平台。
开发者可将其机器人基础模型部署至即将推出的 NVIDIA Jetson Thor 平台,这一平台有助于实现机器人端推理与运行时性能的加速。
好文章,需要你的鼓励
Birk Jernstrom在Shopify收购其上一家初创公司后,创立了货币化平台Polar,专注帮助开发者构建单人独角兽企业。该平台为开发者提供支付基础设施服务,处理全球计费和税务问题,让企业从第一天起就能销售在线产品和SaaS订阅服务。Polar获得了Accel领投的1000万美元种子轮融资,自2024年9月推出以来已吸引1.8万名客户。
这项研究提出了"高效探测"方法,解决了掩码图像建模AI难以有效评估的问题。通过创新的多查询交叉注意力机制,该方法在减少90%参数的同时实现10倍速度提升,在七个基准测试中均超越传统方法。研究还发现注意力质量与分类性能的强相关性,生成可解释的注意力图谱,展现出优异的跨域适应性。团队承诺开源全部代码,推动技术普及应用。
OpenAI首席执行官奥特曼证实,Meta为挖角OpenAI和谷歌DeepMind的顶尖AI研究人员,开出了超过1亿美元的薪酬包。然而,这些挖角努力基本失败。奥特曼表示,员工们认为OpenAI在实现AGI方面机会更大,公司文化更注重创新使命而非高薪。Meta正在组建超级智能团队,但面临OpenAI、Anthropic等竞争对手的激烈竞争。
伊利诺伊大学研究团队开发了CLAIMSPECT系统,通过层次化分解复杂争议、智能检索相关文献、多角度收集观点的方法,将传统的"真假"判断转变为多维度分析。该系统能够自动构建争议话题的分析框架,识别不同观点及其支撑证据,为科学和政治争议提供更全面客观的分析,已在生物医学和国际关系领域验证有效性。