Nvidia正在通过自己的超现实物理模拟和协作产品Omniverse持续推动工业虚拟世界的边界。工业元宇宙是一个与真实世界平行的虚拟空间,在其中模拟真实的物理资产。
近日,Nvidia在针对开发者在线举行的GTC 2022大会期间,宣布推出了Omniverse Cloud,一种基于云的综合软件即服务解决方案,供艺术家、开发人员和企业团队使用Omniverse,在任何地方都可以设计、发布和运营元宇宙应用。
Omniverse是一个实时协作和模拟平台,可实现对世界的大规模真实再现。设计师和工程师团队使用该平台可以重新创建和模拟汽车、飞机、建筑物、工厂等,一个引擎或者是一座工厂的所有部件都可以设计成可以完全实时地模拟物理实体,可以像现实环境中一样做出各种反应。
这被称为“数字孪生”,是一种真实空间和物体的完全虚拟孪生,是工业元宇宙的一个组成部分。因此,通过对数字孪生进行迭代、更改和试验,就可以了解在现实世界中进行高成本的更改之前可能会发生什么。
不管是个人还是团队,使用Omniverse Cloud将能够围绕工作流程展开设计和协作,而无需本地计算能力。
Nvidia创始人、首席执行官黄仁勋表示:“元宇宙,3D互联网,连接了Universal Scene Description中虚拟3D世界,并通过模拟引擎进行查看。我们借助云中的Omniverse,可以连接全球团队来设计、构建和运营虚拟世界和数字孪生。”
Omniverse Cloud运行在Nvidia数据中心内专门设计的云计算架构上,硬件负责运行用于图形和模拟的Nvidia OVX架构,Nvidia HGX服务器用于运行高级AI工作负载。Omniverse Cloud采用了Nvidia Graphics Delivery Network,一个全球规模的分布式数据中心网络,用于交付从Nvidia基于云的视频游戏流媒体服务GeForce Now体验中积累的低延迟元宇宙内容。
让数字孪生在现实世界中发挥作用
数字孪生的强大之处在于,它可以非常精确地在元宇宙中模拟现实世界,就像是在虚拟世界中进行测试和可视化并结合物理世界的最终确定性一样。
零售巨头Lowe's为他们的员工提供了Nvidia Omniverse Enterprise和AR眼镜,就像是让他们具备了X光一般的视觉,例如以前员工为了要看清高处盒子上的小标签,就得爬上梯子才能看到,而有了数字孪生和AR眼镜,他们只需抬起头,眼镜上就可以显示出那个位置商品有关的数据。
员工还可以通过将数字孪生的AI全息图与当前货架上的商品进行比较,通过眼镜查看货架上的库存是否准确——例如货架上是否放错了商品,或者货架上的商品不够了,然后进行纠正和补充。
Lowe's首席数字和信息官Seemantini Godbole表示:“我们借助Nvidia Omniverse以前所未有的方式将数据整合在一起,赋予我们员工一种超能力。”
在门店管理方面它更进了一步,通过数字孪生和AI商店规划工具可以优化顾客的体验,先是检查购物者同时购买的商品,然后,将这些商品放置在靠近的位置,查看顾客步行流量的3D热图,这样员工把商品摆放得更靠近一些,以减少顾客挑选这些商品所需的步数。
Nvidia还宣布与德国铁路运营商Deutsche Bahn的数字部门Digitale Schiene Deutschland展开合作,该部门开始在不建造新轨道的情况下扩大网络容量,这就需要一个安全的自动化列车系统,让列车彼此之间的距离更短,以及涉及建立第一个国家级的轨道网络数字孪生模拟。
由于这涉及到对整个轨道系统进行逼真且物理上精确的模拟,所以是一项非常艰巨的任务,不仅如此,还包括穿过城市和乡村的各种轨道,以及来自包括站台测量和车辆传感器在内的许多来源的数据。
把整个网络的数字孪生嵌入到Omniverse中,Omniverse与真实的铁路网络同时运行,实时输入相同的数据,这样就能够利用AI来监控传感器和其他数据,通过模拟来防止事故发生。
德国铁路公司旗下DB Netz的Lead Perception Group的Ruben Schilling说:“借助Nvidia技术,我们能够开始实现全自动列车网络这一愿景。”
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。