Nvidia公布用于机器人编程的Eureka人工智能系统

Nvidia近日详细介绍了Eureka，一种可以自动训练机器人执行新任务的AI系统。

在一次内部评估中，Nvidia使用Eureka教10个模拟机器人29种不同的动作。工程师通常会在构建机器之前创建机器模拟版本以支持开发工作Eureka教Nvidia的虚拟机器人打开抽屉、表演转笔技巧以及执行其他相对复杂的任务。

很多机器人都是由强化学习模型的神经网络提供动力的。强化学习模型通过反复试验来学习执行任务：它们在模拟环境中多次重复该任务，直到弄清楚如何正确执行该任务。模拟学习环境中，包括一个充当神经网络测试台的虚拟机器人。

在此类项目中，AI训练过程由是一段称为奖励函数的代码进行监督的。当机器人的强化学习模型在学习过程中得出正确的结论时，该函数会“奖励”它，并在错误时对其进行惩罚，通过这种方式，强化学习模型将被引导找到操作机器人的正确方法。

为强化学习模型编写奖励函数历来是一项耗时且技术含量高的任务。据Nvidia称，这次推出的Eureka系统可以实现这个过程的自动化，系统会根据自然语言指令生成奖励函数，例如“教机械臂下棋”等。

Eureka在幕后使用OpenAI GPT-4将用户提示转化为奖励函数。除了提示本身之外，系统还接受所谓的环境代码作为输入，这是一种描述模拟机器人通过训练以执行新任务的代码。

据Nvidia称，Eureka 不仅会生成奖励函数，还会随着时间的推移对其进行不断改进。该系统创建了多个版本的奖励函数，并通过将其应用到模拟机器人来评估工作效果，然后会分析评估结果以找出改进的机会。

Eureka系统还可以在此过程中考虑开发人员的反馈，特别是允许工程师就如何增强机器人的奖励功能提供建议，这些建议已经纳入到代码优化过程中。

Nvidia表示，在测试的80%多的机器人动作中，Eureka奖励函数的表现优于人类编写的代码。结果，作为该项目一部分开发的10个模拟机器人更有效地执行了分配的任务，Nvidia的研究人员记录到机器人性能提高了52%。

参与Eureka开发的Nvidia人工智能研究高级总监Anima Anandkumar表示：“强化学习在过去十年中取得了令人印象深刻的胜利，但仍然存在许多挑战，例如奖励设计，这仍然是一个试错的过程。Eureka是开发新算法的第一步，这种算法集成了生成式学习和强化学习方法来解决那些困难的任务。”

Nvidia已经在GitHub上发布了Eureka的关键组件以及描述其工作原理的学术论文。工程师可以使用Nvidia的Isaac Gym程序运行该软件，该软件是一种专门为支持AI驱动型机器人开发而设计的模拟工具。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

Nvidia公布用于机器人编程的Eureka人工智能系统

来源：至顶网计算频道

2023

10/23

08:59

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会