英伟达按宣布,将对Nvidia AI和Nvidia AI Enterprise平台进行重大升级,新功能旨在推进语音、推荐系统、超大规模推理等工作负载。

英伟达在今天举行的Nvidia GTC 2022上公布了这一消息,与此同时还推出了新的AI Accelerated加速计划,旨在保障使用该平台构建AI应用的性能和可靠性。
这款AI平台是一套工具,其中包括了软件开发套件和AI框架,让开发人员可以使用这些工具跨多个节点进行AI设计、部署、管理和扩展,以支持复杂的训练、推理和机器学习工作负载。
该平台的一个关键组件是Nvidia Triton,一个开源的超大规模模型推理解决方案,现在包括了一个模型导航器,可帮助加速优化AI模型的部署,以及一个用于在Kubernetes中有效扩展的管理服务,以及一个Forest Inference Library用于实现推理树模型。
另一个关键组件Nvidia Riva 2.0已经进行了更新。英伟达表示,Riva是一个语音AI SDK,其中包括了各种具有高识别率的预训练模型,准确性是通用语音识别服务的2倍。最新版本提供了对7种语言的语音识别功能,针对男性和女性声音的、基于深度学习的文本到语音转换功能,以及使用Nvidia TAO工具包进行自定义调整的功能。
该平台还配备了最新版本的Nvidia NeMo Megatron 0.9,一个用于训练大型语言模型的框架,以及Nvidia Merlin 1.0,一个全新的组件,英伟达称之为“端到端推荐框架”,用于构建高性能推荐系统。最后,Nvidia AI现在还配备了Nvidia Maxine,一种音频和视频质量增强软件开发套件,可实现与AI的实时通信。
英伟达表示,Nvidia AI平台从今天开始可供使用,目前多家知名客户正在使用该平台,其中包括Snap。
Snap对话式AI负责人Alan Bekker表示:“在Snapchat上,我们的社区每天使用Lenses的次数超过60亿次。Snap正在使用Nvidia Riva优化我们基于AI的语音功能,并将其提供给Lens Studio创作者,以打造新一代引人入胜的AR体验。”
Nvidia AI Enterprise(即Nvidia AI平台的企业级版本)方面,英伟达表示,现在该版本已经针对所有主流数据中心和云基础设施平台进行了优化、认证和支持。Red Hat OpenShift和VMware vSphere with Tanzu现在支持最新版本的Nvidia Enterprise 2.0。
此外,Nvidia AI Enterprise 2.0增加了对更多AI软件容器的支持,以增强训练和推理能力,例如支持Nvidia TAO Toolkit,让开发人员能够微调预训练的AI模型,更轻松地对其进行定制,即使是在他们缺乏AI或训练数据方面专业知识的情况下。
英伟达表示,最新版本的Nvidia AI Enterprise已经被日本电报电话公司的子公司NTT Communications采用,用于加速自然语言处理和智能视频分析应用的研发,已经取得了良好的效果。
NTT Communication创新中心技术部门总监Shoichiro Henmi表示:“我们有很多应用开发人员现在都在使用加速计算,并且需要一个内部基础设施来提供易于使用的、经济高效的、支持GPU的环境。我们相信Nvidia AI Enterprise将提供一个理想的解决方案,作为支持AI的平台支持我们的VMware vSphere、Kubernetes和云基础架构的大规模开发。”
好文章,需要你的鼓励
雪佛兰Equinox EV本月租赁价格大幅上涨。此前LT1车型月供仅需269美元,如今同等条件下已涨至554美元/月。与此同时,优惠力度也从最高1万美元缩水至1000美元,融资利率从0%升至2.9%。相比之下,2027款Bolt EV月供仅411美元,现代IONIQ 5最低259美元/月,特斯拉Model Y起步459美元/月,Equinox EV的性价比优势明显减弱。
HarnessForge是北航与清华联合提出的AI智能体框架,通过同步进化"操作手册"与"执行助手",让两者相互磨合适配,在多个复杂任务测试中比单独优化任一方的方法最高提升12%。
前沿AI研究机构Decart发布最新世界模型Oasis 3,旨在弥合虚拟仿真与物理AI之间的鸿沟。该模型将超写实交互图形能力与强大物理引擎相结合,可生成动作驱动的视频流,支持多视角环境模拟,延迟低于200毫秒。开发者能够借助自然语言提示,快速构建多样化极端场景,有效解决机器人和自动驾驶领域长期存在的"仿真到现实"差距问题,大幅降低物理AI训练成本。
这篇发表于IEEE期刊的综述提出"看-记-想"框架,系统梳理多模态大模型在视频理解领域的最新进展,覆盖时空感知、记忆建模、推理机制及五大应用场景。