NVIDIA近日在美国丹佛举行的Siggraph大会上宣布,正在大幅扩展NVIDIA Inference Microservices(NIM)库以涵盖物理环境、高级视觉建模和各种垂直应用。
亮点包括Hugging Face推理即服务上线了NVIDIA云,以及对三维训练和推理的扩展支持。
NIM是一组容器化微服务,作为NVIDIA AI Enterprise套件的一个组成部分提供给用户,可以简化和加快AI模型的部署。每个NIM都是针对各种硬件设置量身定制的优化推理引擎,可以通过应用程序接口访问,以减少延迟和运营成本,提高性能和可扩展性。开发者可以使用NIM快速部署AI应用,而无需进行大量定制,并且使用的是专有数据微调模型。
NVIDIA表示,Hugging Face将在NVIDIA DGX云上提供推理即服务,为Hugging Face的400万开发者提供更高的性能,让他们更轻松地访问无服务器推理。Hugging Face提供了一个专门用于自然语言处理和机器学习开发和准备的平台,以及一个用于NLP任务(例如文本分类、翻译和问答)的预训练模型库,还提供了一个大型数据集存储库,这些数据集针对Transformers的使用进行了优化,Transformers是一个开源Python库,提供使用NLP模型的资源。
NVIDIA还宣布了在生成式物理AI方面取得的进步,包括用于构建交互式视觉AI代理的Metropolis参考工作流程。Metropolis是一组开发者工作流程和工具,用于在所有类型的硬件上构建、部署和扩展生成式AI应用。NVIDIA还宣布推出了新的NIM微服务,可以帮助开发者训练物理机器以处理复杂的任务。
3D世界
这次公告包括了三个新的Fast Voxel Database NIM(FVDB)微服务,支持用于三维世界的新深度学习框架。FVDB是一个新的深度学习框架,用于生成现实世界的AI就绪虚拟表示。它是建立在OpenVDB之上的,后者是一个行业标准的结构和程序库,用于模拟和渲染水、火、烟和云等稀疏体积数据。
FVDB的空间规模是先前框架的4倍,性能提高了3.5倍,提供了对大量真实世界数据集的访问路径,通过组合以前需要多个深度学习库的功能来简化流程。
NVIDIA同时宣布的还有三项微服务——USD Code、USD Search和USD Validate,都使用通用场景描述开源交换格式来创建任意3D场景。
USD Code可以回答OpenUSD知识问题并生成Python代码,USD Search支持自然语言访问大量OpenUSD 3D和图像数据库。USD Validate会检查上传文件与OpenUSD发布版本的兼容性,使用Omniverse云API生成完全渲染的路径跟踪图像。
NVIDIA Omniverse和模拟技术副总裁Rev Lebaredian表示:“我们构建了世界上第一个能够理解基于OpenUSD的语言、几何、材料、物理和空间的生成式AI模型。”
物理AI支持
NVIDIA宣布为物理AI量身定制的NIM支持语音和翻译、视觉和逼真的动画和行为。视觉AI代理使用计算机视觉功能来感知和与物理世界交互并执行推理任务。
它们是由一类称为视觉语言模型的新型生成式AI模型提供支持的,这些模型可以增强决策能力、准确性、交互性和性能。NVIDIA的AI和DGX超级计算机可以用于训练物理AI模型,Omniverse和OVX超级计算机可用于完善数字孪生中的技能。
应用领域包括机器人,因此NVIDIA表示将为世界领先的机器人制造商、AI模型开发商和软件制造商提供一套服务、模型和计算平台,以开发、训练和构建下一代人形机器人(如图所示)。
产品包括用于机器人模拟和学习的NIM微服务和框架、用于运行多级机器人工作负载的OSMO编排服务以及支持AI和模拟的远程操作工作流程,可显着减少训练机器人所需的人类演示数据量。
Lebaredian说,生成式AI的视觉输出通常是“随机且不准确的,艺术家无法按照自己的意愿编辑有限的细节,借助Omniverse和NIM微服务,设计师或艺术家就可以构建一个地面实况3D场景,为生成式AI提供条件。他们在Omniverse中组装场景,从而将品牌认可的资产(如可乐瓶)和各种道具和环境模型聚合到一个场景中。”
NVIDIA NIM将提供Getty Images的4K图像生成API和Shutterstock的3D资产生功能,用于使用文本或图像提示生成图像,两者都使用了NVIDIA Edify,一种用于视觉生成式AI的多模式架构。
Lebaredian表示:“自2016年以来,我们一直在投资OpenUSD,从而使工业企业和物理AI开发者能够更轻松、更快速地开发高性能模型,让Omniverse也变得更轻松、更快速。”NVIDIA还与共同创立Open USD联盟的Apple公司展开合作,构建从图形交付网络到Apple Vision Pro的混合渲染管道流。现在开发者可以通过早期访问计划获得在Omniverse上实现此功能的软件开发工具包和API。
开发者可以使用NIM微服务和Omniverse Replicator等来构建支持AI的生成式合成数据管道,解决经常限制模型训练的真实世界数据短缺问题。
即将推出的NIM或者USD Layout、USD Smart Material以及FDB Mesh Generation,可以生成由Omniverse API渲染的、基于OpenUSD的网格。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。