以ChatGPT为代表的生成式AI应用持续爆发,其流畅的文本对话不光可以用于对话场景,甚至编写软件和加速药物研发。作为这些AI应用背后的强大引擎,大型语言模型(LLM)正在被越来越多的行业所采用。
虽然LLM的表现令人印象深刻,但是如何确保回答的内容可信可靠也是业界讨论的焦点。近日,NVIDIA将其多年研究成果——NeMo Guardrails开源,专为帮助用户保证新型AI赋能的应用的安全性而开发。

NeMo Guardrails确保大型语言模型(LLM)驱动的智能应用准确、恰当、符合主题且安全。该软件包含了企业为提高可以生成文本的AI应用程序的安全性所需的所有代码、示例和文档。
构建三种边界,确保LLM安全
生成式AI的安全性是人们普遍关心的问题。NVIDIA设计NeMo Guardrails是为了让它适用于所有LLM,例如OpenAI的ChatGPT。
该软件可以让开发者调整LLM驱动的应用,以确保模型的安全性并在公司的专业领域内。
NeMo Guardrails使开发者能够构建三种边界:
几乎每个软件开发人员都可以使用NeMo Guardrails,他们不需要成为机器学习专家或数据科学家,只需几行代码就可以快速创建新的规则。
开源,并易于集成
NVIDIA NeMo框架的大部分内容已在GitHub上作为开放源码提供。而且NVIDIA正在将NeMo Guardrails整合到NVIDIA NeMo框架中,该框架包含用户使用公司的专有数据来训练和调整语言模型所需的一切。
由于NeMo Guardrails是开源的,因此它可以与企业应用开发人员使用的所有工具搭配使用。例如,它可以在LangChain上运行。LangChain是一个开源工具包,越来越多的开发者用它来将第三方应用嵌入到LLM中。
LangChain工具包的创建者Harrison Chase表示:“用户可以轻松地将NeMo Guardrails添加到LangChain工作流程中,以快速为其AI应用设置安全边界。”
此外,NeMo Guardrails专为适用于广泛的基于LLM的应用而设计,例如Zapier。Zapier是一个被超过200万家企业使用的自动化平台,它见证了用户如何将AI集成到他们的工作中。
Zapier的AI首席产品经理Reid Robinson表示:“功能安全,信息安全和信任是负责任的AI开发的基石,我们对NVIDIA主动将这些护栏嵌入AI智能系统感到兴奋。我们期待着让AI成为未来可靠并值得信赖的一部分所带来的益处。”
其实,NeMo作为NVIDIA AI Enterprise软件平台的一部分,还可以以完整的支持包的形式提供给企业。
NeMo还可作为一项服务使用。作为NVIDIA AI Foundations的一部分,这套云服务面向希望基于自己的数据集和领域知识创建、运行自定义生成式AI模型的企业。
通过使用NeMo,韩国领先的移动运营商构建了一个智能助手,该助手目前已经与客户进行了800万次对话;瑞典的一个研究团队使用NeMo创建了LLM,为该国医院、政府和商业机构自动生成文本。
结语
确保生成式AI的安全是重中之重,NeMo Guardrails是NVIDIA的一种有益探索,帮助企业确保他们的智能服务满足功能安全、隐私和信息安全的要求,推动AI安全工作。
好文章,需要你的鼓励
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
这项由CMU与亚马逊AGI联合完成的研究揭示了当前AI系统的重大缺陷:即使最先进的模型也不知道何时该说"我不知道"。研究团队开发的RefusalBench评估系统通过176种语言操作技巧动态生成测试案例,发现顶级AI在多文档任务中的拒绝准确率低于50%。这项研究不仅提供了标准化测试工具,更为构建诚实可靠的AI系统指明了方向。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
这项由中国人民大学联合腾讯开发的LaSeR技术,发现了AI在生成答案最后一刻会无意中透露对答案质量的评估。通过观察这个"最后一词效应",研究人员开发出了一种让AI高效进行自我评估的方法,在几乎不增加计算成本的情况下,大幅提升了AI的自我验证能力,为构建更可信的AI系统开辟了新路径。