在接受媒体采访时,Roese描绘了一幅由三个截然不同但相互关联的市场组成的AI格局:预生成式AI、AI模型训练和企业AI。
他指出,虽然前两个市场已经很成熟,但企业AI市场潜力最大,不过采用曲线较慢。他解释说:“AI不是一个单一的市场——是三个完全独立但又相互关联的市场。”他指出,计算机视觉和机器人等生成式AI之前出现的技术,都是把数据提炼为生成式AI可使用格式的关键层。
第二个市场专注于训练大规模AI模型,目前是由超大规模企业以及争夺搜索和社交网络霸主地位的科技巨头主导,而戴尔在提供必要的基础设施方面发挥着关键作用。
然而,Roese认为第三个市场——企业AI——正处于转型的边缘,他指出,虽然训练市场因科技巨头对“大型集群”的大规模投资而成为新闻头条,但企业市场更专注于把AI应用于业务流程中。
“企业AI是关于了解企业中哪些流程使企业运转起来,并通过应用AI来显著改善这些流程”,这就意味着使用AI来优化供应链、改善客户服务和增强产品开发。
Roese认为,一个关键的区别是,企业主要关注推理——通过现有模型运行数据——而不是训练自己的模型,这就需要一种不同的基础设施方法:一种分布式的、针对推理进行优化的、并且可能延伸到边缘的方法。Roese观察到:“在过去六个月中,我们看到企业市场日趋成熟”,他指出,现成的AI工具和功能正在兴起,这些工具和功能针对企业,通常更擅长消费技术而不是生产技术。
六项核心能力
Roese概述了可以解决大多数企业AI用例场景的六项核心能力,并敦促CIO们应该专注于这些基础要素,而不是构建一大堆能力,这将有助于他们优先考虑把AI投资集中在那些直接利用核心能力和竞争优势的领域。
这六项能力包括基于检索增强生成(RAG)的聊天机器人、编码代理、内容AI引擎、数据管理代理、分析代理和微调基础设施。Roese表示,这些功能足以让今天的戴尔实现300多个AI用例。
具体而言,代理AI架构的兴起代表着一个重要的转折点。这些架构由更小的、更专业的AI模型组成,像“数字劳动力”一样执行特定的任务,提供更大的控制力、可解释性、以及通过微调整合专有数据的能力。
Roese表示:“你实际上是在建立一支由具有不同技能的人组成的团队”,这使得人类和AI之间能够采取一种更具协作性的方法,人类可以协调和监督这些数字代理的工作。
Roese预计,代理架构将随着标准化程度的提高而变得更加主流,从而推动企业从2025年中期开始采用面向代理的AI系统,“这可能是我们第一次看到企业AI生产显著加速,”他说。
在谈到数据泄露和代理管理方面的担忧时,Roese表示,不同类型的代理将需要不同的生命周期管理方法。
例如,具有稳定且特定任务的代理,可以像更新软件包一样进行管理,而与动态实时数据交互的代理,则应该使用RAG来访问数据,而不是将数据嵌入代理本身。
为了更好地控制和解释,组织还可以使用一组专门的代理,而不是单个的整体代理。集合中的每个代理都可以拥有针对特定功能量身定制的不同管理生命周期。
例如,在本地机器上运行的通信代理,就可以使用LangChain等工具与单个大型语言模型或者可以访问组织库存实时信息的代理进行通信。“两个代理之间的协作为您提供了看似实时的答案,尽管从生命周期的角度来看,唯一实时的是第二个代理背后的数据库,”Roese说。
他承认企业在驾驭复杂AI方面面临的挑战,并指出其中的主要障碍就是治理、“随机供应商”对推动大多数AI项目的业务部门所带来的影响,以及对可预测成本的需求。
尽管如此,Roese仍然对未来持乐观态度,建议企业应该专注于符合其核心竞争力的战略性AI实施,并利用现成的工具,“随着你实施更好的治理,事情变得更加现成,你实际上可以更快速地行动起来。”
好文章,需要你的鼓励
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调,并强调时间因果性的重要性。面对LLM技术局限,业界开始探索神经符号AI等替代方案。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。