Nvidia TensorRT深度学习推理平台在会话AI领域取得新突破

Nvidia发布了用于高性能深度学习推理的新版本TensorRT软件平台，以强化自己的人工智能战略。

TensorRT是一个将高性能深度学习推理优化器与运行时相结合的平台，可为AI应用提供低延迟、高吞吐量的推理。

推理是AI的一个重要方面，AI训练涉及算法理解数据集的能力演化，而推理是指AI能够对这些数据进行操作以推断特定查询的答案。

新版本的TensorRT在性能方面有了显着改善，包括大幅缩短了在最先进AI语言模型之一——Bidirectional Encoder Representations from Transformers -Large（BERT-Large）——上的推理时间。众所周知，BERT-Large是一种自然语言处理训练方法，涉及在大型文本语料库（如维基百科）上训练通用语言理解模型，然后把该模型作为下游NLP任务的基础，例如回答人们的问题。

Nvidia表示，TensorRT 6新增的优化功能可以将B44与T4 GPU的算法推理时间缩短至5.8毫秒，低于之前的10毫秒性能阈值。

Nvidia表示，这次改进的性能足够高，使得BERT可以被企业首次部署到生产环境中。传统观点认为，应该在不到10毫秒的时间内执行NLP模型，才能提供自然的、引人入胜的体验。

Nvidia表示，还对该平台进行了优化，加速了对于语音识别、医疗应用3D图像分割、工业自动化中基于图像的应用相关任务的推断。

Nvidia表示，TensorRT 6还增加了对动态输入批大小的支持，这有助于加速AI应用，例如计算需求波动的在线服务等。TensorRT Open Source Repository 也有升级，新增的训练样本有助于加快基于语言和图像的应用的推断。

Constellation Research分析师Holger Mueller表示，这次改进很及时，因为会话AI平台的竞争正在全面展开。

“但是Nvidia仍然需要解决下一代应用的本地部署问题，除非它设法将TensorRT平台变成公有云。在这方面Nvidia有很好的经验，但需要一定的时间才能实现。”

Nvidia表示，现在已经可以通过产品页面下载TensorRT 6平台。

来源：siliconANGLE

0赞

好文章，需要你的鼓励

Nvidia TensorRT深度学习推理平台在会话AI领域取得新突破

来源：siliconANGLE

2019

09/18

11:37

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

这款古怪的 AI 智能手机可以创建你的数字分身

Hugging Face 首席科学官担忧 AI 正在成为"服务器上的应声虫"

AI 公司效仿 DeepSeek，通过"蒸馏"技术打造低成本模型

物理 AI 如何通过嵌入式智能改变行业格局

Sergey Brin 表示：如果谷歌员工每周工作 60 小时，AGI 指日可待

Tencent 发布新 AI 模型，称速度快于 DeepSeek-R1

IBM 发布新的 Granite 3.2 系列模型，实现按需推理能力

Anthropic 的 Claude 3.7 Sonnet 推理模型可以按需延长思考时间

DeepSeek 超越"开放权重"AI，计划发布源代码

iPhone 16E 证明苹果急切希望用户使用其 AI 功能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: