2025 年 5 月 19 日 ,NVIDIA 在COMPUTEX 上发布以下全新技术:NVIDIA Isaac GR00T N1.5,这是 NVIDIA 首个开源、通用且完全可定制的人形机器人推理与技能基础模型的首次更新;用于合成运动生成的 NVIDIA Isaac GR00T-Dreams Blueprint;以及用于加速人形机器人开发的 NVIDIA Blackwell 系统。
包括 Agility Robotics、波士顿动力、傅利叶、Foxlink、银河通用、Mentee Robotics、NEURA Robotics、General Robotics、Skild AI 和小鹏机器人在内的多家人形机器人和机器人开发商,正采用 NVIDIA Isaac™ 平台技术推动人形机器人的开发与部署。
NVIDIA 创始人兼首席执行官黄仁勋表示:“物理 AI 与机器人技术将开启新一轮工业革命。从机器人的 AI 大脑到用于训练的仿真环境,再到训练基础模型的 AI 超级计算机,NVIDIA 为机器人开发的每个环节提供核心技术支持。”
全新 Isaac GR00T 数据生成 Blueprint 填补数据鸿沟
黄仁勋在 COMPUTEX 主题演讲中展示的 NVIDIA Isaac GR00T-Dreams,为开发者提供生成海量合成运动数据(即神经轨迹)的解决方案。物理 AI 开发者可利用这些数据训练机器人适应动态环境等新行为的能力。
开发者可首先针对其机器人对 Cosmos Predict 世界基础模型(WFM)进行后训练。随后,GR00T-Dreams 仅需单张图像作为输入,即可生成机器人在新环境中执行新任务的视频。该 Blueprint 随后提取动作 tokens(经压缩且易于处理的数据片段),用于教会机器人如何执行这些新任务。
GR00T-Dreams Blueprint 是对今年三月 GTC 大会发布的 Isaac GR00T-Mimic Blueprint 的补充。GR00T-Mimic 使用 NVIDIA Omniverse™ 和 NVIDIA Cosmos™ 平台增强现有数据,而 GR00T-Dreams 则使用 Cosmos 生成全新数据。
全新 Isaac GR00T 模型推动人形机器人开发
NVIDIA 研究院借助 GR00T-Dreams Blueprint 生成合成训练数据,仅用 36 小时就完成了 GR00T N1.5 模型的开发(基于 GR00T N1 更新)。相比之下,如果采用人工数据收集的方式,这一过程需耗时近三个月。
GR00T N1.5 展现出更强的环境适应性与工作空间配置调整能力,并可通过用户指令识别目标物体。此次更新大幅提升了模型在工业物料分拣、存放等常见制造场景中的任务成功率。
当前,AeiRobot、Foxlink、光轮智能与 NEURA Robotics 等企业已率先采用 GR00T N 系列模型。AeiRobot 利用该模型使 ALICE4 机器人能够理解自然语言指令,执行工业场景中的复杂抓取与放置工作流。Foxlink 借助该模型提升工业机械臂的灵活性与作业效率。光轮智能通过模型验证合成数据,加速工厂场景人形机器人部署。NEURA Robotics 正评估模型性能,以加速家庭自动化系统的开发进程。
全新机器人仿真与数据生成框架加速训练流程
开发高技能人形机器人需要海量多样化数据支撑,但真实数据采集与处理成本高昂,且机器人需要在物理世界中进行测试,这也可能带来成本和风险。
为帮助填补数据和测试缺口,NVIDIA 推出以下仿真技术:
Foxconn 与 Foxlink 正在使用 GR00T-Mimic Blueprint 加速其合成运动操作生成,优化工业机器人训练流程。Agility Robotics、波士顿动力、傅利叶、Mentee Robotics、NEURA Robotics、小鹏机器人等正通过 NVIDIA Isaac Sim 与 Isaac Lab 推进人形机器人仿真训练。Skild AI 运用仿真框架开发通用机器人智能系统,General Robotics 则将其集成到自身的机器人智能平台。
开发者可将其机器人基础模型部署至即将推出的 NVIDIA Jetson Thor 平台,这一平台有助于实现机器人端推理与运行时性能的加速。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。