Nvidia发布生成式AI微服务可利用企业数据提供准确答案

Nvidia今天宣布推出了一项新的生成式AI微服务，旨在允许企业将自定义聊天机器人、copilot和AI摘要工具连接到实时专有的企业数据以提供更准确的结果。

这项名为NeMo Retriever的新服务是Nvidia NeMo云原生框架和工具系列中的一部分，用于构建、定制和部署生成式AI模型，旨在让企业组织能够把检索增强生成功能构建到他们的生成式AI应用中。

检索增强生成（RAG）是一种通过利用从外部来源检索的事实和数据填补大型语言模型“知识”空白以提高生成式AI模型准确性和安全性的方法。一个大型语言模型接受前期训练，为其提供大量一般任务知识和能力，例如理解对话提示、总结和提供问答能力。训练既昂贵又耗时，因此通常只进行一次或者很少进行训练，以为部署模型做准备。

然而，一旦部署，模型本身将缺乏实时信息和最新的特定领域专业知识，这可能会导致不准确和所谓的“幻觉”——也就是大型语言模型会自信但错误地回答问题。

使用NeMo Retriever，就可以把多种来源（包括数据库、HTML、PDF、图像、视频和其他方式）的最新数据输入大型语言模型，这意味着模型将拥有由企业客户自己专有来源提供的、更全面的事实集，这些事实可以在数据可用时进行更新。数据可以驻留在任何地方，包括云、数据中心或本地环境中，并且可以安全地访问这些数据。

Nvidia公司超大规模和高性能计算副总裁Ian Buck表示：“这是整个企业聊天机器人领域的圣杯，因为绝大多数有用数据都是专有数据，不是嵌入这些模型中的公开可用数据，而是公司内部可用的数据。因此，将AI和客户数据库相结合，可以使其更高效、更准确、更有用，并让客户能够优化模型的功能。”

通过添加专有数据可以减少不准确的答案，因为大型语言模型可以利用更好的上下文信息来产生结果，从而提高准确性。与研究论文如何提供信息来源的引用类似，Retriever的RAG功能会根据企业内部特定领域知识提供额外的专家信息来源，以便更好地为大型语言模型提供信息，使其能够根据问题提供更好的、更准确的答案。

Nvidia表示，与社区主导的开源RAG工具包不同，Retriever旨在支持商业型和生产就绪的生成式AI模型，这些模型已经可用并针对RAG功能、企业支持和托管安全补丁进行了优化。

目前，电子系统设计公司Cadence Design Systems、Dropbox、SAP和ServiceNow等企业客户已经在和Nvidia合作，利用新功能将RAG引入他们定制的生成式AI工具、应用和服务中。

Cadence公司总裁、首席执行官Anirudh Devgan表示，该公司的研究人员正在与Nvidia展开合作，利用Retriever通过提高准确性来帮助生产出更高质量的电子产品。Devgan表示：“生成式AI引入了创新方法来满足客户需求，例如在设计过程早期发现潜在缺陷的工具。

Buck表示，通过使用Retriever，客户可以用更少的时间训练生成式AI模型，以获得更准确的结果，这意味着企业客户可以采用更多现成的模型，简单地部署模型并使用他们自己的内部数据，而无需花费大量的时间、费用和精力来持续训练模型以使保持模型的最新状态。

NeMo Retriever将添加上述RAG功能，作为Nvidia AI Enterprise端到端云原生软件平台的一个组成部分，该平台主要用于简化AI应用的开发。从今天开始，开发者就可以注册抢先体验NeMo Retriever。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

Nvidia发布生成式AI微服务 可利用企业数据提供准确答案

来源：至顶网计算频道

2023

11/29

14:09

分享

点赞

AI智能体漏洞挖掘成本骤降，Anthropic呼吁AI防御

Spotify年度盘点2025首次推出多人互动功能"盘点派对"

英国SAP用户因商业套件重启授权迷局感到困惑

AWS发布Graviton5定制CPU，为云工作负载带来强劲性能

美光放弃Crucial品牌：告别消费级存储市场

手机里的NPU越来越强，为什么AI体验还在原地踏步？

如何使用现有基础设施让数据做好AI准备

IT领导者快问快答：思科光网络公司首席数字信息官Craig Williams分享AI转型经验

Anthropic CEO警告AI行业泡沫化，批评"YOLO"式投资

雅虎利用AI实时总结橄榄球比赛精彩内容

押注AI智能体，奇奇科技跨越十年的“换挡”与远航

联想天禧AI及创新终端设备在2025 AIE博览会获两项大奖，引领个人AI体验创新

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

PTC 推出生成式人工智能现场服务助理 ServiceMax AI

NVIDIA Blackwell 现已在云端全面可用

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Nvidia发布生成式AI微服务可利用企业数据提供准确答案