英伟达按宣布,将对Nvidia AI和Nvidia AI Enterprise平台进行重大升级,新功能旨在推进语音、推荐系统、超大规模推理等工作负载。

英伟达在今天举行的Nvidia GTC 2022上公布了这一消息,与此同时还推出了新的AI Accelerated加速计划,旨在保障使用该平台构建AI应用的性能和可靠性。
这款AI平台是一套工具,其中包括了软件开发套件和AI框架,让开发人员可以使用这些工具跨多个节点进行AI设计、部署、管理和扩展,以支持复杂的训练、推理和机器学习工作负载。
该平台的一个关键组件是Nvidia Triton,一个开源的超大规模模型推理解决方案,现在包括了一个模型导航器,可帮助加速优化AI模型的部署,以及一个用于在Kubernetes中有效扩展的管理服务,以及一个Forest Inference Library用于实现推理树模型。
另一个关键组件Nvidia Riva 2.0已经进行了更新。英伟达表示,Riva是一个语音AI SDK,其中包括了各种具有高识别率的预训练模型,准确性是通用语音识别服务的2倍。最新版本提供了对7种语言的语音识别功能,针对男性和女性声音的、基于深度学习的文本到语音转换功能,以及使用Nvidia TAO工具包进行自定义调整的功能。
该平台还配备了最新版本的Nvidia NeMo Megatron 0.9,一个用于训练大型语言模型的框架,以及Nvidia Merlin 1.0,一个全新的组件,英伟达称之为“端到端推荐框架”,用于构建高性能推荐系统。最后,Nvidia AI现在还配备了Nvidia Maxine,一种音频和视频质量增强软件开发套件,可实现与AI的实时通信。
英伟达表示,Nvidia AI平台从今天开始可供使用,目前多家知名客户正在使用该平台,其中包括Snap。
Snap对话式AI负责人Alan Bekker表示:“在Snapchat上,我们的社区每天使用Lenses的次数超过60亿次。Snap正在使用Nvidia Riva优化我们基于AI的语音功能,并将其提供给Lens Studio创作者,以打造新一代引人入胜的AR体验。”
Nvidia AI Enterprise(即Nvidia AI平台的企业级版本)方面,英伟达表示,现在该版本已经针对所有主流数据中心和云基础设施平台进行了优化、认证和支持。Red Hat OpenShift和VMware vSphere with Tanzu现在支持最新版本的Nvidia Enterprise 2.0。
此外,Nvidia AI Enterprise 2.0增加了对更多AI软件容器的支持,以增强训练和推理能力,例如支持Nvidia TAO Toolkit,让开发人员能够微调预训练的AI模型,更轻松地对其进行定制,即使是在他们缺乏AI或训练数据方面专业知识的情况下。
英伟达表示,最新版本的Nvidia AI Enterprise已经被日本电报电话公司的子公司NTT Communications采用,用于加速自然语言处理和智能视频分析应用的研发,已经取得了良好的效果。
NTT Communication创新中心技术部门总监Shoichiro Henmi表示:“我们有很多应用开发人员现在都在使用加速计算,并且需要一个内部基础设施来提供易于使用的、经济高效的、支持GPU的环境。我们相信Nvidia AI Enterprise将提供一个理想的解决方案,作为支持AI的平台支持我们的VMware vSphere、Kubernetes和云基础架构的大规模开发。”
好文章,需要你的鼓励
AI数据训练师负责确保AI模型训练数据的准确性和可行性,是薪酬丰厚的热门职业。两项新研究显示,该职位年收入在6.5万至18万美元之间,专业领域专家薪酬更高。这一角色已从简单的数据标记发展为高度专业化的认知工作,需要细致的推理能力、深厚的专业知识和多语言能力。随着生成式AI工具兴起,行业正从普通工作者转向专业领域专家,计算机科学学位非必需,但数据标注经验有帮助。
延世大学研究团队开发出FlowBlending视频生成加速技术,通过智能分配大小模型的工作阶段,在保持视频质量不变的前提下将生成速度提升65%。该技术发现视频生成过程中只有开头和结尾阶段需要大模型,中间阶段可用小模型替代,实现了效率与质量的完美平衡,且可与现有技术无缝集成。
Rust资深开发者Steve Klabnik在AI助手Claude的帮助下设计了新的系统编程语言Rue。该语言旨在提供无垃圾回收的内存安全保障,同时比Rust和Zig提供更高级的易用性。Klabnik表示,通过与Claude合作,两周内完成了7万行Rust代码,远超此前独自开发的进度。Claude参与了大部分代码编写工作,而Klabnik负责方向指导和设计决策,展现了AI在编程语言开发中的巨大潜力。
斯坦福大学研究团队开发的Dream2Flow系统通过让机器人观看AI生成的演示视频来学习操作技能。系统提取视频中物体的3D运动轨迹作为指导,让机器人能够零样本完成多种日常任务,包括移动物品、开关门窗等操作,在真实环境测试中取得了最高80%的成功率。