英伟达按宣布,将对Nvidia AI和Nvidia AI Enterprise平台进行重大升级,新功能旨在推进语音、推荐系统、超大规模推理等工作负载。
英伟达在今天举行的Nvidia GTC 2022上公布了这一消息,与此同时还推出了新的AI Accelerated加速计划,旨在保障使用该平台构建AI应用的性能和可靠性。
这款AI平台是一套工具,其中包括了软件开发套件和AI框架,让开发人员可以使用这些工具跨多个节点进行AI设计、部署、管理和扩展,以支持复杂的训练、推理和机器学习工作负载。
该平台的一个关键组件是Nvidia Triton,一个开源的超大规模模型推理解决方案,现在包括了一个模型导航器,可帮助加速优化AI模型的部署,以及一个用于在Kubernetes中有效扩展的管理服务,以及一个Forest Inference Library用于实现推理树模型。
另一个关键组件Nvidia Riva 2.0已经进行了更新。英伟达表示,Riva是一个语音AI SDK,其中包括了各种具有高识别率的预训练模型,准确性是通用语音识别服务的2倍。最新版本提供了对7种语言的语音识别功能,针对男性和女性声音的、基于深度学习的文本到语音转换功能,以及使用Nvidia TAO工具包进行自定义调整的功能。
该平台还配备了最新版本的Nvidia NeMo Megatron 0.9,一个用于训练大型语言模型的框架,以及Nvidia Merlin 1.0,一个全新的组件,英伟达称之为“端到端推荐框架”,用于构建高性能推荐系统。最后,Nvidia AI现在还配备了Nvidia Maxine,一种音频和视频质量增强软件开发套件,可实现与AI的实时通信。
英伟达表示,Nvidia AI平台从今天开始可供使用,目前多家知名客户正在使用该平台,其中包括Snap。
Snap对话式AI负责人Alan Bekker表示:“在Snapchat上,我们的社区每天使用Lenses的次数超过60亿次。Snap正在使用Nvidia Riva优化我们基于AI的语音功能,并将其提供给Lens Studio创作者,以打造新一代引人入胜的AR体验。”
Nvidia AI Enterprise(即Nvidia AI平台的企业级版本)方面,英伟达表示,现在该版本已经针对所有主流数据中心和云基础设施平台进行了优化、认证和支持。Red Hat OpenShift和VMware vSphere with Tanzu现在支持最新版本的Nvidia Enterprise 2.0。
此外,Nvidia AI Enterprise 2.0增加了对更多AI软件容器的支持,以增强训练和推理能力,例如支持Nvidia TAO Toolkit,让开发人员能够微调预训练的AI模型,更轻松地对其进行定制,即使是在他们缺乏AI或训练数据方面专业知识的情况下。
英伟达表示,最新版本的Nvidia AI Enterprise已经被日本电报电话公司的子公司NTT Communications采用,用于加速自然语言处理和智能视频分析应用的研发,已经取得了良好的效果。
NTT Communication创新中心技术部门总监Shoichiro Henmi表示:“我们有很多应用开发人员现在都在使用加速计算,并且需要一个内部基础设施来提供易于使用的、经济高效的、支持GPU的环境。我们相信Nvidia AI Enterprise将提供一个理想的解决方案,作为支持AI的平台支持我们的VMware vSphere、Kubernetes和云基础架构的大规模开发。”
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。