英伟达按宣布,将对Nvidia AI和Nvidia AI Enterprise平台进行重大升级,新功能旨在推进语音、推荐系统、超大规模推理等工作负载。
英伟达在今天举行的Nvidia GTC 2022上公布了这一消息,与此同时还推出了新的AI Accelerated加速计划,旨在保障使用该平台构建AI应用的性能和可靠性。
这款AI平台是一套工具,其中包括了软件开发套件和AI框架,让开发人员可以使用这些工具跨多个节点进行AI设计、部署、管理和扩展,以支持复杂的训练、推理和机器学习工作负载。
该平台的一个关键组件是Nvidia Triton,一个开源的超大规模模型推理解决方案,现在包括了一个模型导航器,可帮助加速优化AI模型的部署,以及一个用于在Kubernetes中有效扩展的管理服务,以及一个Forest Inference Library用于实现推理树模型。
另一个关键组件Nvidia Riva 2.0已经进行了更新。英伟达表示,Riva是一个语音AI SDK,其中包括了各种具有高识别率的预训练模型,准确性是通用语音识别服务的2倍。最新版本提供了对7种语言的语音识别功能,针对男性和女性声音的、基于深度学习的文本到语音转换功能,以及使用Nvidia TAO工具包进行自定义调整的功能。
该平台还配备了最新版本的Nvidia NeMo Megatron 0.9,一个用于训练大型语言模型的框架,以及Nvidia Merlin 1.0,一个全新的组件,英伟达称之为“端到端推荐框架”,用于构建高性能推荐系统。最后,Nvidia AI现在还配备了Nvidia Maxine,一种音频和视频质量增强软件开发套件,可实现与AI的实时通信。
英伟达表示,Nvidia AI平台从今天开始可供使用,目前多家知名客户正在使用该平台,其中包括Snap。
Snap对话式AI负责人Alan Bekker表示:“在Snapchat上,我们的社区每天使用Lenses的次数超过60亿次。Snap正在使用Nvidia Riva优化我们基于AI的语音功能,并将其提供给Lens Studio创作者,以打造新一代引人入胜的AR体验。”
Nvidia AI Enterprise(即Nvidia AI平台的企业级版本)方面,英伟达表示,现在该版本已经针对所有主流数据中心和云基础设施平台进行了优化、认证和支持。Red Hat OpenShift和VMware vSphere with Tanzu现在支持最新版本的Nvidia Enterprise 2.0。
此外,Nvidia AI Enterprise 2.0增加了对更多AI软件容器的支持,以增强训练和推理能力,例如支持Nvidia TAO Toolkit,让开发人员能够微调预训练的AI模型,更轻松地对其进行定制,即使是在他们缺乏AI或训练数据方面专业知识的情况下。
英伟达表示,最新版本的Nvidia AI Enterprise已经被日本电报电话公司的子公司NTT Communications采用,用于加速自然语言处理和智能视频分析应用的研发,已经取得了良好的效果。
NTT Communication创新中心技术部门总监Shoichiro Henmi表示:“我们有很多应用开发人员现在都在使用加速计算,并且需要一个内部基础设施来提供易于使用的、经济高效的、支持GPU的环境。我们相信Nvidia AI Enterprise将提供一个理想的解决方案,作为支持AI的平台支持我们的VMware vSphere、Kubernetes和云基础架构的大规模开发。”
好文章,需要你的鼓励
美光发布新款2600客户端QLC固态硬盘,采用自适应写入技术动态优化缓存,使QLC闪存达到TLC级写入性能。该技术通过顶层SLC缓存处理新写入数据,二级TLC缓存应对SLC满载情况,空闲时将数据迁移至QLC模式。硬盘无DRAM设计,采用Phison四通道控制器和美光276层3D NAND,提供512GB至2TB容量选择,相比竞品QLC和TLC固态硬盘,顺序写入速度提升63%,随机写入速度提升49%。
清华和AIRI研究团队提出循环一致性图像编辑方法,仅需4步即可实现高质量图像编辑,速度比传统方法快10倍。该方法通过训练AI反复练习"看图-重画"过程提升图像理解能力,结合智能引导机制确保编辑质量,在多项评测中超越现有快速方法,为AI图像编辑的普及应用奠定基础。
在AMD AI推进大会上,CEO苏姿丰展示了公司在AI硬件和软件方面的显著进展。新一代MI350系列GPU性能提升4倍,高端MI355X在内存、计算吞吐量和性价比方面均优于英伟达B200。公司计划2026年推出Helios机架级平台,ROCm 7推理性能提升3.5倍。尽管在GPU训练、TCO优势等方面表现良好,但在NIMs微服务、企业级GPU市场渗透等领域仍需加强,以进一步缩小与英伟达的差距。
中科院、北大、清华联合开发的DualTHOR平台首次为双臂人形机器人提供真实家庭环境仿真训练。该平台不仅支持双手协作任务,还引入意外机制模拟现实不确定性。实验发现现有AI模型在双手协调方面表现不佳,为未来家庭服务机器人发展指明方向。