2025 年 5 月 19 日 ,NVIDIA 在COMPUTEX 上发布以下全新技术:NVIDIA Isaac GR00T N1.5,这是 NVIDIA 首个开源、通用且完全可定制的人形机器人推理与技能基础模型的首次更新;用于合成运动生成的 NVIDIA Isaac GR00T-Dreams Blueprint;以及用于加速人形机器人开发的 NVIDIA Blackwell 系统。
包括 Agility Robotics、波士顿动力、傅利叶、Foxlink、银河通用、Mentee Robotics、NEURA Robotics、General Robotics、Skild AI 和小鹏机器人在内的多家人形机器人和机器人开发商,正采用 NVIDIA Isaac™ 平台技术推动人形机器人的开发与部署。
NVIDIA 创始人兼首席执行官黄仁勋表示:“物理 AI 与机器人技术将开启新一轮工业革命。从机器人的 AI 大脑到用于训练的仿真环境,再到训练基础模型的 AI 超级计算机,NVIDIA 为机器人开发的每个环节提供核心技术支持。”
全新 Isaac GR00T 数据生成 Blueprint 填补数据鸿沟
黄仁勋在 COMPUTEX 主题演讲中展示的 NVIDIA Isaac GR00T-Dreams,为开发者提供生成海量合成运动数据(即神经轨迹)的解决方案。物理 AI 开发者可利用这些数据训练机器人适应动态环境等新行为的能力。
开发者可首先针对其机器人对 Cosmos Predict 世界基础模型(WFM)进行后训练。随后,GR00T-Dreams 仅需单张图像作为输入,即可生成机器人在新环境中执行新任务的视频。该 Blueprint 随后提取动作 tokens(经压缩且易于处理的数据片段),用于教会机器人如何执行这些新任务。
GR00T-Dreams Blueprint 是对今年三月 GTC 大会发布的 Isaac GR00T-Mimic Blueprint 的补充。GR00T-Mimic 使用 NVIDIA Omniverse™ 和 NVIDIA Cosmos™ 平台增强现有数据,而 GR00T-Dreams 则使用 Cosmos 生成全新数据。
全新 Isaac GR00T 模型推动人形机器人开发
NVIDIA 研究院借助 GR00T-Dreams Blueprint 生成合成训练数据,仅用 36 小时就完成了 GR00T N1.5 模型的开发(基于 GR00T N1 更新)。相比之下,如果采用人工数据收集的方式,这一过程需耗时近三个月。
GR00T N1.5 展现出更强的环境适应性与工作空间配置调整能力,并可通过用户指令识别目标物体。此次更新大幅提升了模型在工业物料分拣、存放等常见制造场景中的任务成功率。
当前,AeiRobot、Foxlink、光轮智能与 NEURA Robotics 等企业已率先采用 GR00T N 系列模型。AeiRobot 利用该模型使 ALICE4 机器人能够理解自然语言指令,执行工业场景中的复杂抓取与放置工作流。Foxlink 借助该模型提升工业机械臂的灵活性与作业效率。光轮智能通过模型验证合成数据,加速工厂场景人形机器人部署。NEURA Robotics 正评估模型性能,以加速家庭自动化系统的开发进程。
全新机器人仿真与数据生成框架加速训练流程
开发高技能人形机器人需要海量多样化数据支撑,但真实数据采集与处理成本高昂,且机器人需要在物理世界中进行测试,这也可能带来成本和风险。
为帮助填补数据和测试缺口,NVIDIA 推出以下仿真技术:
Foxconn 与 Foxlink 正在使用 GR00T-Mimic Blueprint 加速其合成运动操作生成,优化工业机器人训练流程。Agility Robotics、波士顿动力、傅利叶、Mentee Robotics、NEURA Robotics、小鹏机器人等正通过 NVIDIA Isaac Sim 与 Isaac Lab 推进人形机器人仿真训练。Skild AI 运用仿真框架开发通用机器人智能系统,General Robotics 则将其集成到自身的机器人智能平台。
开发者可将其机器人基础模型部署至即将推出的 NVIDIA Jetson Thor 平台,这一平台有助于实现机器人端推理与运行时性能的加速。
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。