NVIDIA近日在美国丹佛举行的Siggraph大会上宣布,正在大幅扩展NVIDIA Inference Microservices(NIM)库以涵盖物理环境、高级视觉建模和各种垂直应用。
亮点包括Hugging Face推理即服务上线了NVIDIA云,以及对三维训练和推理的扩展支持。
NIM是一组容器化微服务,作为NVIDIA AI Enterprise套件的一个组成部分提供给用户,可以简化和加快AI模型的部署。每个NIM都是针对各种硬件设置量身定制的优化推理引擎,可以通过应用程序接口访问,以减少延迟和运营成本,提高性能和可扩展性。开发者可以使用NIM快速部署AI应用,而无需进行大量定制,并且使用的是专有数据微调模型。
NVIDIA表示,Hugging Face将在NVIDIA DGX云上提供推理即服务,为Hugging Face的400万开发者提供更高的性能,让他们更轻松地访问无服务器推理。Hugging Face提供了一个专门用于自然语言处理和机器学习开发和准备的平台,以及一个用于NLP任务(例如文本分类、翻译和问答)的预训练模型库,还提供了一个大型数据集存储库,这些数据集针对Transformers的使用进行了优化,Transformers是一个开源Python库,提供使用NLP模型的资源。
NVIDIA还宣布了在生成式物理AI方面取得的进步,包括用于构建交互式视觉AI代理的Metropolis参考工作流程。Metropolis是一组开发者工作流程和工具,用于在所有类型的硬件上构建、部署和扩展生成式AI应用。NVIDIA还宣布推出了新的NIM微服务,可以帮助开发者训练物理机器以处理复杂的任务。
3D世界
这次公告包括了三个新的Fast Voxel Database NIM(FVDB)微服务,支持用于三维世界的新深度学习框架。FVDB是一个新的深度学习框架,用于生成现实世界的AI就绪虚拟表示。它是建立在OpenVDB之上的,后者是一个行业标准的结构和程序库,用于模拟和渲染水、火、烟和云等稀疏体积数据。
FVDB的空间规模是先前框架的4倍,性能提高了3.5倍,提供了对大量真实世界数据集的访问路径,通过组合以前需要多个深度学习库的功能来简化流程。
NVIDIA同时宣布的还有三项微服务——USD Code、USD Search和USD Validate,都使用通用场景描述开源交换格式来创建任意3D场景。
USD Code可以回答OpenUSD知识问题并生成Python代码,USD Search支持自然语言访问大量OpenUSD 3D和图像数据库。USD Validate会检查上传文件与OpenUSD发布版本的兼容性,使用Omniverse云API生成完全渲染的路径跟踪图像。
NVIDIA Omniverse和模拟技术副总裁Rev Lebaredian表示:“我们构建了世界上第一个能够理解基于OpenUSD的语言、几何、材料、物理和空间的生成式AI模型。”
物理AI支持
NVIDIA宣布为物理AI量身定制的NIM支持语音和翻译、视觉和逼真的动画和行为。视觉AI代理使用计算机视觉功能来感知和与物理世界交互并执行推理任务。
它们是由一类称为视觉语言模型的新型生成式AI模型提供支持的,这些模型可以增强决策能力、准确性、交互性和性能。NVIDIA的AI和DGX超级计算机可以用于训练物理AI模型,Omniverse和OVX超级计算机可用于完善数字孪生中的技能。
应用领域包括机器人,因此NVIDIA表示将为世界领先的机器人制造商、AI模型开发商和软件制造商提供一套服务、模型和计算平台,以开发、训练和构建下一代人形机器人(如图所示)。
产品包括用于机器人模拟和学习的NIM微服务和框架、用于运行多级机器人工作负载的OSMO编排服务以及支持AI和模拟的远程操作工作流程,可显着减少训练机器人所需的人类演示数据量。
Lebaredian说,生成式AI的视觉输出通常是“随机且不准确的,艺术家无法按照自己的意愿编辑有限的细节,借助Omniverse和NIM微服务,设计师或艺术家就可以构建一个地面实况3D场景,为生成式AI提供条件。他们在Omniverse中组装场景,从而将品牌认可的资产(如可乐瓶)和各种道具和环境模型聚合到一个场景中。”
NVIDIA NIM将提供Getty Images的4K图像生成API和Shutterstock的3D资产生功能,用于使用文本或图像提示生成图像,两者都使用了NVIDIA Edify,一种用于视觉生成式AI的多模式架构。
Lebaredian表示:“自2016年以来,我们一直在投资OpenUSD,从而使工业企业和物理AI开发者能够更轻松、更快速地开发高性能模型,让Omniverse也变得更轻松、更快速。”NVIDIA还与共同创立Open USD联盟的Apple公司展开合作,构建从图形交付网络到Apple Vision Pro的混合渲染管道流。现在开发者可以通过早期访问计划获得在Omniverse上实现此功能的软件开发工具包和API。
开发者可以使用NIM微服务和Omniverse Replicator等来构建支持AI的生成式合成数据管道,解决经常限制模型训练的真实世界数据短缺问题。
即将推出的NIM或者USD Layout、USD Smart Material以及FDB Mesh Generation,可以生成由Omniverse API渲染的、基于OpenUSD的网格。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。