Nvidia近日推出超现实实时3D图形协作和模拟平台Omniverse的主要版本,该平台将允许企业使用OpenUSD和人工智能构建更好的3D模型和场景。
Nvidia Omniverse平台为艺术家、工程师、创作者和其他人提供了一套“元宇宙”工具,让他们在虚拟世界上进行大规模远程协作,以重新创建和模拟他们可以想象的任何东西,让他们借助这个强大的工具可以模拟包括建筑物、汽车、飞机和工厂在内的虚拟世界,用于视频游戏或工业解决方案,包括可以像现实世界一样与实际物理反应的“数字孪生”。
Nvidia在SIGGRAPH 2023期间宣布推出的Nvidia Omniverse更新,其中包括了对Universal Scene Description(OpenUSD)进行增强,OpenUSD是一种开放框架,允许艺术家和工程师在大型3D项目上进行协作,包括连接云和生成式AI应用编程接口的新技术组合。
开发人员使用生成式AI和OpenUSD将能够以全新的方式构建全新的应用和3D环境。他们利用人工智能的力量可以简单地输入他们想要的内容,并创建USD规格的内容或者生成渲染,从而节省时间和精力。
开发人员通过ChatUSD可以访问一种生成式AI大型语言模型,这种模型可以从文本生成Python-USD代码脚本并回答有关USD的问题,它使用Nvidia自己的NeMo AI框架开发,该框架允许任何人通过提高速度并快速编写代码来成为OpenUSD方面专家,它的运行方式与OpenAI ChatGPT生成计算机代码的方式类似,但接受了OpenUSD Python脚本的训练,可以配合艺术家或者开发人员手头已有的脚本一起使用。
DeepSearch是一个大型语言模型代理,可以根据文本提示通过3D模型和未标记资产进行快速语义搜索。许多企业开发人员和艺术家都有大量触手可及的3D模型库,并经常搜索这些模型,但模型并不总是得到了很好的分类或者位于可搜索的库中。拥有一个可以让他们提出问题的搜索代理,可以帮助他们快速找到他们想要的东西。
Nvidia公司联合创始人、首席执行官黄仁勋表示:“正如HTML引发了2D互联网的重大计算革命一样,OpenUSD将触发协作3D和工业数字化时代。”
Nvidia表示,通过使用新的Omniverse USD Composer,开发人员、艺术家和工程师将能够同时大规模且快速地构建高级场景合成,并在同事和不同应用之间轻松共享这些内容。
Nvidia最近与Apple、Adobe、Autodesk和Walt Disney的Pixar Animation Studios联合成立了OpenUSD联盟,一个将于本月早些时候构建和开发OpenUSD的行业机构。该联盟将致力于普及OpenUSD,并在进一步发展的同时提供该标准的书面规范。Nvidia还提供了该框架的功能路线图,使其对于自主工业机器人和工业人工智能有更大的用处。
Adobe和Nvidia还宣布进一步围绕Omniverse展开合作,将Adobe Firefly(Adobe的图像生成基础AI模型系列)引入平台中。Adobe推出了Firefly作为一套图像生成式AI工具,其操作类似于主流的图像生成模型如Stable Diffusion、Midjourney和OpenAI DALL-E 2。Adobe在今年5月将其添加到Photoshop中,允许用户使用“生成填充”通过文本提示修改图像。
Nvidia Omniverse和模拟技术副总裁Rev Lebaredian表示:“最新更新的Omniverse让开发人员可以通过OpenUSD利用生成式AI来增强他们的工具,并让企业可以构建更大的、更复杂的世界规模模拟,作为其工业应用的数字测试场。”
Omniverse其他主要改进包括新增了Kit Extension Registry,为开发人员提供一个中央存储库用于访问和共享Omniverse扩展(这些扩展是应用内的插件),从而提供了一个简单的资源用于发现他们正在使用的内容以及影响应用的方式,让他们可以快速打开和关闭从Nvidia提供的600多种不同的Omniverse核心扩展以构建自定义应用功能。
Nvidia还通过新的渲染优化功能提高了Omniverse的效率,这些优化利用了新的Nvidia RTX GPU以及Ada Lovelace架构中的DLSS 3.0技术,此外还有原生RTX支持的扩展现实开发工具套件,可提供“空间计算”体验用于开发虚拟和增强现实应用。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。