Nvidia发布了用于高性能深度学习推理的新版本TensorRT软件平台,以强化自己的人工智能战略。
TensorRT是一个将高性能深度学习推理优化器与运行时相结合的平台,可为AI应用提供低延迟、高吞吐量的推理。
推理是AI的一个重要方面,AI训练涉及算法理解数据集的能力演化,而推理是指AI能够对这些数据进行操作以推断特定查询的答案。
新版本的TensorRT在性能方面有了显着改善,包括大幅缩短了在最先进AI语言模型之一——Bidirectional Encoder Representations from Transformers -Large(BERT-Large)——上的推理时间。众所周知,BERT-Large是一种自然语言处理训练方法,涉及在大型文本语料库(如维基百科)上训练通用语言理解模型,然后把该模型作为下游NLP任务的基础,例如回答人们的问题。
Nvidia表示,TensorRT 6新增的优化功能可以将B44与T4 GPU的算法推理时间缩短至5.8毫秒,低于之前的10毫秒性能阈值。
Nvidia表示,这次改进的性能足够高,使得BERT可以被企业首次部署到生产环境中。传统观点认为,应该在不到10毫秒的时间内执行NLP模型,才能提供自然的、引人入胜的体验。
Nvidia表示,还对该平台进行了优化,加速了对于语音识别、医疗应用3D图像分割、工业自动化中基于图像的应用相关任务的推断。
Nvidia表示,TensorRT 6还增加了对动态输入批大小的支持,这有助于加速AI应用,例如计算需求波动的在线服务等。TensorRT Open Source Repository 也有升级,新增的训练样本有助于加快基于语言和图像的应用的推断。
Constellation Research分析师Holger Mueller表示,这次改进很及时,因为会话AI平台的竞争正在全面展开。
“但是Nvidia仍然需要解决下一代应用的本地部署问题,除非它设法将TensorRT平台变成公有云。在这方面Nvidia有很好的经验,但需要一定的时间才能实现。”
Nvidia表示,现在已经可以通过产品页面下载TensorRT 6平台。
好文章,需要你的鼓励
软件开发瓶颈是现代企业面临的关键挑战。本文探讨了消除瓶颈的有效策略,包括优化沟通、提高可视化、自动化流程和培养共同责任文化。专家建议通过异步更新、看板管理和自动化工具来提高效率。同时强调了数据质量、跨团队协作和持续改进的重要性。文章还提到了新兴技术如AI在解决瓶颈问题中的潜在应用。
随着人工智能技术的发展,深度伪造内容在网络上大量涌现,可能对我们的健康造成潜在威胁。从虚假名人代言到有害的AI生成医疗建议,深度伪造正在助长一波危险的虚假信息浪潮。本文探讨了深度伪造在医疗保健领域的负面影响,以及如何在这个充满虚假信息的时代保护自己的健康。
INCYMO.AI 推出了一个革新性的 AI 驱动创意平台,专注于移动游戏广告制作。该平台基于 10 万多个市场验证广告的数据分析,通过 AI 技术为游戏营销人员提供创意构思和广告生成服务。在创意疲劳、用户获取成本上升和隐私限制的当前环境下,该平台为游戏营销开辟了一条数据驱动的全新道路。
Databricks 与 Palantir 签署合作协议,开发出更优的大语言模型微调方法,并与 Anthropic 达成为期五年的战略联盟,将 Claude 大语言模型整合到其数据湖平台中。此次合作将为企业客户提供更强大的 AI 能力,包括军工级安全性、高效的模型训练以及全面的数据治理,助力企业打造专属 AI 应用。