Nvidia近日推出超现实实时3D图形协作和模拟平台Omniverse的主要版本,该平台将允许企业使用OpenUSD和人工智能构建更好的3D模型和场景。

Nvidia Omniverse平台为艺术家、工程师、创作者和其他人提供了一套“元宇宙”工具,让他们在虚拟世界上进行大规模远程协作,以重新创建和模拟他们可以想象的任何东西,让他们借助这个强大的工具可以模拟包括建筑物、汽车、飞机和工厂在内的虚拟世界,用于视频游戏或工业解决方案,包括可以像现实世界一样与实际物理反应的“数字孪生”。
Nvidia在SIGGRAPH 2023期间宣布推出的Nvidia Omniverse更新,其中包括了对Universal Scene Description(OpenUSD)进行增强,OpenUSD是一种开放框架,允许艺术家和工程师在大型3D项目上进行协作,包括连接云和生成式AI应用编程接口的新技术组合。
开发人员使用生成式AI和OpenUSD将能够以全新的方式构建全新的应用和3D环境。他们利用人工智能的力量可以简单地输入他们想要的内容,并创建USD规格的内容或者生成渲染,从而节省时间和精力。
开发人员通过ChatUSD可以访问一种生成式AI大型语言模型,这种模型可以从文本生成Python-USD代码脚本并回答有关USD的问题,它使用Nvidia自己的NeMo AI框架开发,该框架允许任何人通过提高速度并快速编写代码来成为OpenUSD方面专家,它的运行方式与OpenAI ChatGPT生成计算机代码的方式类似,但接受了OpenUSD Python脚本的训练,可以配合艺术家或者开发人员手头已有的脚本一起使用。
DeepSearch是一个大型语言模型代理,可以根据文本提示通过3D模型和未标记资产进行快速语义搜索。许多企业开发人员和艺术家都有大量触手可及的3D模型库,并经常搜索这些模型,但模型并不总是得到了很好的分类或者位于可搜索的库中。拥有一个可以让他们提出问题的搜索代理,可以帮助他们快速找到他们想要的东西。
Nvidia公司联合创始人、首席执行官黄仁勋表示:“正如HTML引发了2D互联网的重大计算革命一样,OpenUSD将触发协作3D和工业数字化时代。”
Nvidia表示,通过使用新的Omniverse USD Composer,开发人员、艺术家和工程师将能够同时大规模且快速地构建高级场景合成,并在同事和不同应用之间轻松共享这些内容。
Nvidia最近与Apple、Adobe、Autodesk和Walt Disney的Pixar Animation Studios联合成立了OpenUSD联盟,一个将于本月早些时候构建和开发OpenUSD的行业机构。该联盟将致力于普及OpenUSD,并在进一步发展的同时提供该标准的书面规范。Nvidia还提供了该框架的功能路线图,使其对于自主工业机器人和工业人工智能有更大的用处。
Adobe和Nvidia还宣布进一步围绕Omniverse展开合作,将Adobe Firefly(Adobe的图像生成基础AI模型系列)引入平台中。Adobe推出了Firefly作为一套图像生成式AI工具,其操作类似于主流的图像生成模型如Stable Diffusion、Midjourney和OpenAI DALL-E 2。Adobe在今年5月将其添加到Photoshop中,允许用户使用“生成填充”通过文本提示修改图像。
Nvidia Omniverse和模拟技术副总裁Rev Lebaredian表示:“最新更新的Omniverse让开发人员可以通过OpenUSD利用生成式AI来增强他们的工具,并让企业可以构建更大的、更复杂的世界规模模拟,作为其工业应用的数字测试场。”
Omniverse其他主要改进包括新增了Kit Extension Registry,为开发人员提供一个中央存储库用于访问和共享Omniverse扩展(这些扩展是应用内的插件),从而提供了一个简单的资源用于发现他们正在使用的内容以及影响应用的方式,让他们可以快速打开和关闭从Nvidia提供的600多种不同的Omniverse核心扩展以构建自定义应用功能。
Nvidia还通过新的渲染优化功能提高了Omniverse的效率,这些优化利用了新的Nvidia RTX GPU以及Ada Lovelace架构中的DLSS 3.0技术,此外还有原生RTX支持的扩展现实开发工具套件,可提供“空间计算”体验用于开发虚拟和增强现实应用。
好文章,需要你的鼓励
Core Memory播客主持人Ashley Vance近日与OpenAI首席研究官Mark Chen进行了一场长达一个半小时的对话。这是Chen近年来最公开、最深入的一次访谈,话题覆盖人才争夺战、研究战略、AGI时间表,以及他个人的管理哲学。
波士顿大学团队发现当今多模态AI存在严重"偏科"问题:面对冲突的文字、视觉、听觉信息时,AI过分依赖文字而忽视真实感官内容。研究团队构建MMA-Bench测试平台,通过创造视听冲突场景暴露了主流AI模型的脆弱性,并提出模态对齐调优方法,将模型准确率从25%提升至80%,为构建更可靠的多模态AI系统提供重要突破。
脑机接口技术正快速发展,特别是非侵入性方法取得重大突破。通过EEG、fNIRS、MEG等传感技术结合人工智能,实现思维解码、图像重构等功能。聚焦超声波技术能精确调节大脑深层结构,为神经疾病治疗带来新希望。消费级可穿戴设备已能改善睡眠、缓解抑郁。这些技术将重塑人机交互方式,从医疗应用扩展至认知增强领域。
UC伯克利研究团队发现了一种名为"双重话语"的AI攻击方法,能够通过简单的词汇替换绕过当前所有主流聊天机器人的安全防护。攻击者只需用无害词汇替换危险词汇,就能让AI在不知不觉中提供危险信息。研究揭示了现有AI安全机制的根本缺陷,迫切需要开发新的防护策略来应对这一威胁。