随着“代理式人工智能”( 代理式AI)正悄然进入人工智能开发社区,越发成为科技巨头和AI领域专家们热议的新焦点。
NVIDIA认为, 代理式AI是人工智能发展的下一个前沿,它通过复杂的推理和迭代规划,自主解决复杂的多步骤问题,从而显著提高各行业的生产力和运营效率。
OpenAI前首席科学家、安全超级智能公司联合创始人伊利亚·苏茨克维(Ilya Sutskever)预测,下一代AI模型将“以一种真正的方式实现代理化”,未来的系统不仅具备自主性,更将拥有强大的推理能力。
代理式AI通过四个关键步骤实现高效的问题解决——感知(Perception),推理(Reasoning),执行(Execution)和学习(Learning)。在感知阶段,AI智能体从传感器、数据库和数字接口等多种来源收集并处理数据,提取有意义的特征,识别物体或环境中的相关实体。推理阶段,大型模型作为核心推理引擎,深入理解任务需求,生成解决方案,并协调调用专门模型完成特定功能。执行阶段中, 代理式AI通过API与外部工具和软件集成,快速高效地完成规划任务。而在学习阶段, 代理式AI利用交互中产生的反馈数据,驱动“数据飞轮”机制,不断优化系统性能和模型能力。这种闭环流程使 代理式AI能够在复杂场景中展现卓越的自主决策与执行能力。
其实, 代理式AI不仅能自动化重复性任务,还能感知环境、进行复杂的推理和决策,成为解决企业效率瓶颈的关键技术。在这一趋势下,NVIDIA在2025年CES期间,推出了一系列新的 代理式AI工具和技术,包括Llama Nemotron模型、 代理式 AI Blueprint,以及Cosmos Nemotron视觉语言模型。这些创新不仅代表了技术的巨大飞跃,也为企业应对数据洪流中的挑战提供了全新的解决方案。
NVIDIA首席执行官黄仁勋表示,人工智能正迈入一个新时代—— 代理式AI时代。专业的AI代理可以帮助人们解决复杂问题并自动执行重复性任务,从而使各行各业的企业都能实现前所未有的生产力提升。
然而,这些先进的AI代理需要一套针对代理AI功能和能力进行优化的多生成式AI模型系统。这种复杂性意味着,对强大、高效的企业级模型的需求比以往任何时候都更加迫切。
从边缘到云端:解锁代理AI新玩法
代理式AI的核心在于构建能够感知、推理并采取行动的智能代理。要实现这一目标,背后的生成式AI模型系统必须兼具高效的计算性能和卓越的准确性。NVIDIA推出的Llama Nemotron系列模型通过剪枝和蒸馏技术优化了计算效率,在模型规模和性能之间找到了最佳平衡,为企业构建代理AI提供了坚实基础。
来源:NVIDIA
通过NVIDIA NeMo定制并连接到业务知识 Llama Nemotron和Cosmos Nemotron模型系列即将以Nano、Super和Ultra的大小提供,为在各种规模部署AI代理提供选项。
Nano版本专为实时应用设计,低延迟特性使其非常适合边缘设备和个人电脑。无论是小型零售店还是复杂的工业场景,它都能提供及时的响应;Super版本则将高吞吐量和准确性相结合,在单GPU上即可提供卓越性能,是企业级应用的理想选择;而Ultra版本面向要求最高性能的数据中心应用,能够支持复杂的大规模部署场景。
如今,时间与资源的竞争尤为激烈。从金融服务到零售管理,企业希望能够快速应对市场变化,优化资源配置。灵活部署选项,让企业可以更快地集成AI代理,以便更有效地完成任务。此外,其还能够适应不同规模的需求,从个人电脑到数据中心,无缝支持各种计算环境。这种灵活性和效率,为企业提供了以前难以实现的生产力提升。
为解决传统AI模型在部署过程中的效率问题,还提供了高度适配的解决方案。据了解SAP通过其Joule平台将这些模型应用于多任务AI代理互动,让企业用户得以快速实现目标。而ServiceNow则利用其平台能力开发出能够解决跨功能复杂问题的高级AI服务,进一步提升了业务效率。
事实上,Llama Nemotron模型的开放性也是其受到关注的重要原因。Meta等合作伙伴的积极评价表明,开放式模型的设计降低了开发门槛,企业可以更灵活地根据自身需求调整和部署。这种开放性和高效性,不仅满足了边缘计算和云计算的多样化需求,也让代理式AI的应用范围进一步扩大。
从概念到现实:AI代理创变行业规则
来源:NVIDIA
为了帮助企业将代理式AI从概念转化为现实应用,NVIDIA推出了代理式 AI Blueprint。这些代理式 AI Blueprint是整合多种技术能力的端到端解决方案,为开发者提供了一条清晰的路径,将复杂的AI开发过程简化为可操作的步骤。
代理式 AI Blueprint不仅仅是工具的集合,它是一种系统性的设计思路。通过整合NVIDIA NeMo微服务和NIM微服务,代理式 AI Blueprint为开发者提供了灵活的模块化组件,支持从报告生成到实时语音代理的多种应用场景。借助这些工具,开发者能够快速响应不同业务需求,构建高效且可靠的AI代理。
NVIDIA的合作伙伴可以通过代理式AI编排层,为人工智能代理的高效协作提供了关键支撑。全新推出的合作伙伴代理式 AI Blueprint,作为代理式AI编排的行业标杆,现已开放获取。该代理式 AI Blueprint与NVIDIA AI Enterprise软件平台无缝集成,包括NIM微服务和NVIDIA NeMo Retriever,不仅显著提升了检索准确性,还大幅降低了代理工作流程的延迟,为企业智能化运营提供强大助力。
CrewAI、Daily、LangChain、LlamaIndex 和 Weights & Biases,作为代理式AI领域的“编排大师”,正在与NVIDIA携手书写AI应用新图景。这些顶尖工具通过与NVIDIA AI Enterprise软件平台(包括NVIDIA NIM微服务和NeMo)深度整合,推出了五大代理式 AI Blueprint。尤其是新增的代理式AI合作伙伴代理式 AI Blueprint,更像是一张通往未来的地图,为开发者铺设了打造下一代AI应用的基石。这些创新将渗透各行各业,重塑我们的工作和生活方式。具体而言:
CrewAI:降低代码维护的门槛。通过整合NIM微服务和NeMo检索器,CrewAI实现了代码文档化的高效处理。对于开发团队而言,这意味着代码库的维护与扩展将变得更加轻松。这项功能尤其适用于依赖复杂代码库的企业,帮助显著降低维护成本,同时提升开发效率。
Daily:语音代理开启实时对话新时代。借助Pipecat框架与NVIDIA Riva语音识别技术,Daily打造了一款支持实时对话的语音代理。这一解决方案不仅优化了客户服务效率,还为语音交互技术的未来应用开辟了更多可能性。从客户支持到虚拟助手,这种技术突破将持续为企业赋能。
LangChain:精准生成结构化报告。LangChain依托Llama 3.3 70B模型,提供结构化报告生成功能,让用户可以根据需求自定义主题与大纲。这项功能显著提升了信息搜索与报告生成效率,帮助企业以更加针对性的方式管理复杂数据。对于需要数据驱动决策的组织来说,LangChain提供了灵活且强大的支持。
LlamaIndex:加速高质量内容创作。作为文档研究助手的代理式 AI Blueprint,LlamaIndex通过检索增强生成能力,为内容创作者提供了高效创作工具。无论是媒体机构还是研究组织,这一技术都能大幅提升信息整合与内容创作的效率,满足高质量内容生产的需求。
Weights & Biases:优化AI开发流程。Weights & Biases构建的AI虚拟助手专注于调试与性能追踪,帮助研发团队优化开发流程,加速应用的迭代速度。对于需要快速测试与迭代的企业,这一解决方案无疑是提高研发效率的利器,为AI开发注入了更多可能性。
这些代理式 AI Blueprint所展现的能力远不止工具本身,它们是推动行业变革的重要驱动力。从消费品到医疗健康,各个领域正在通过 代理式 AI Blueprint加速数字化转型。特别是在复杂数据管理与智能分析方面,这些代理式 AI Blueprint为企业提供了强大的支持。
从视觉到价值:AI代理掀起新浪潮
当超级个体时代加速到来,未来包括金融、内容、医疗、咨询等各个领域的人力资本行业可能都会出现大量“solo组织”,如何能更好的使用各种软件,AI工具和创造力将会成为核心竞争力。
其实,视频数据是“solo组织”必须充分挖掘的重要资源。从数据上看,每年产生的数万亿小时视频中,绝大部分尚未被深入分析,这不仅浪费了潜在的信息价值,也无形中增加了运营成本与安全风险。NVIDIA在这一领域的突破性技术,为视频数据分析注入了全新的可能性与效率。
NVIDIA推出的Cosmos Nemotron视觉语言模型(VLMs)为核心的Metropolis平台,为开发者提供了构建智能视频分析代理的工具。这些代理能够通过链式思维推理和任务规划,从视频内容中快速提取关键信息,以超过30倍于实时观看的速度完成分析。这种高效性使其成为工业、体育和娱乐领域的理想选择。
基于NVIDIA Metropolis平台,集成了Cosmos Nemotron视觉语言模型(VLM)、Llama Nemotron大型语言模型(LLM)以及NeMo Retriever等核心组件,可实现比实时观看快30倍的视频批量处理。开发者通过这些工具,可简化构建复杂AI代理的流程,实现任务规划、工具调用等关键功能。这些视觉代理还能与其他具备不同技能的AI代理结合,支持企业从边缘到云的灵活部署。
此外,这一工具不仅着眼当前,更能从历史视频中提取关键信息,用于问题解决和新流程创建,帮助企业实现智能化转型。通过这些强大的功能,视觉AI代理正在为工业运营开辟新路径。
在工业场景中,视觉AI代理大有用武之地。具有视觉感知和分析能力的人工智能代理正为工业运营注入新动能。通过微调,这些代理可确保在复杂生产过程中严格遵循标准操作程序,精准分析动作细节,提升生产力并减少浪费。在资产管理方面,AI代理可利用3D体积估算和多摄像头流分析,优化仓储空间利用效率。
在安全性要求下,AI代理能够快速处理大量视频,生成带有上下文信息的事故报告,同时确保个人防护装备合规,大幅提升工人安全性。它们还能识别异常活动,快速响应以防止事故和生产问题,无论是在工厂、仓库还是交通枢纽等场景。此外,AI代理善于从历史视频中提取相关信息,用于解决问题或优化流程设计。凭借这些强大的功能,视觉AI代理正在重塑工业运营的效率与安全标准
体育行业则通过视频分析技术提升运动员表现。在CES开幕主题演讲中,NVIDIA创始人兼首席执行官Jensen Huang展示了一个人工智能视频分析代理,该代理评估了业余棒球运动员与职业棒球运动员的快球投掷技能。视频分析人工智能代理使用黄为旧金山巨人队棒球队投出的仪式性第一球拍摄的视频,能够提出需要改进的领域。
截取自NVIDIA视频
在娱乐行业,代理通过分析用户行为和偏好,帮助内容创作者生产更具针对性的作品。NVIDIA的Media2计划正利用这些技术构建更加智能和定制化的内容生态,为媒体行业带来新一轮增长。
视觉感知能力的提升不仅带来了即时效益,还为长远的智能社会建设奠定了基础。从优化工业流程到提升用户体验,NVIDIA的技术正在逐步改变我们对视频数据的认知与利用方式。
目前,埃森哲、美力、德勤、安永、Infosys、Linker Vision、Pegatron、TATA咨询服务(TCS)、Telit Cinterion和VAST等NVIDIA合作伙伴正在将构建用于视频分析的代理式 AI Blueprint整合到其开发人员工作流程中。
写在最后
从技术研发到行业赋能,NVIDIA正在通过推动 代理式AI,定义新的“智能生态论”。无论是Llama Nemotron模型的技术创新, 代理式 AI Blueprint的实际应用,还是视觉感知技术的赋能突破,NVIDIA的每一步都在推动代理式AI从理论走向实践。这标志着AI发展的一个新阶段,也为企业迎接数据时代的挑战提供了强有力的支持。未来,随着代理式AI的不断成熟,它将成为企业和社会实现智能化转型的核心驱动力。
好文章,需要你的鼓励
本文探讨了企业高管对 IT 部门的认知不足问题。作者指出,尽管 IT 在现代生活中至关重要,但大多数高管对 IT 人员和流程仍然一无所知。文章呼吁 CIO 需要采取措施,通过人性化 IT、改进沟通等方式,帮助企业高层更好地理解 IT 的价值和作用。
目前,行业分析机构普遍将数据中心市场的一切业务下滑,都归咎于客户关注点从通用计算转向AI类工作负载。正如我们在2024年10月的第二季度以太网数据公布报告中所指出,从数据中心、园区及边缘用例的总体形势来看,以太网交换机市场正处于衰退周期。
人工智能技术将在2025年深刻改变生命科学行业。多模态AI将加速药物研发和诊断,AI代理将优化工作流程,直观搜索将促进科研创新,AI驱动的客户体验将提升患者参与度。这些技术将缩短药物开发周期,简化临床试验流程,推动个性化医疗发展,最终改善患者健康结果。