在接受媒体采访时,Roese描绘了一幅由三个截然不同但相互关联的市场组成的AI格局:预生成式AI、AI模型训练和企业AI。
他指出,虽然前两个市场已经很成熟,但企业AI市场潜力最大,不过采用曲线较慢。他解释说:“AI不是一个单一的市场——是三个完全独立但又相互关联的市场。”他指出,计算机视觉和机器人等生成式AI之前出现的技术,都是把数据提炼为生成式AI可使用格式的关键层。
第二个市场专注于训练大规模AI模型,目前是由超大规模企业以及争夺搜索和社交网络霸主地位的科技巨头主导,而戴尔在提供必要的基础设施方面发挥着关键作用。
然而,Roese认为第三个市场——企业AI——正处于转型的边缘,他指出,虽然训练市场因科技巨头对“大型集群”的大规模投资而成为新闻头条,但企业市场更专注于把AI应用于业务流程中。
“企业AI是关于了解企业中哪些流程使企业运转起来,并通过应用AI来显著改善这些流程”,这就意味着使用AI来优化供应链、改善客户服务和增强产品开发。
Roese认为,一个关键的区别是,企业主要关注推理——通过现有模型运行数据——而不是训练自己的模型,这就需要一种不同的基础设施方法:一种分布式的、针对推理进行优化的、并且可能延伸到边缘的方法。Roese观察到:“在过去六个月中,我们看到企业市场日趋成熟”,他指出,现成的AI工具和功能正在兴起,这些工具和功能针对企业,通常更擅长消费技术而不是生产技术。
六项核心能力
Roese概述了可以解决大多数企业AI用例场景的六项核心能力,并敦促CIO们应该专注于这些基础要素,而不是构建一大堆能力,这将有助于他们优先考虑把AI投资集中在那些直接利用核心能力和竞争优势的领域。
这六项能力包括基于检索增强生成(RAG)的聊天机器人、编码代理、内容AI引擎、数据管理代理、分析代理和微调基础设施。Roese表示,这些功能足以让今天的戴尔实现300多个AI用例。
具体而言,代理AI架构的兴起代表着一个重要的转折点。这些架构由更小的、更专业的AI模型组成,像“数字劳动力”一样执行特定的任务,提供更大的控制力、可解释性、以及通过微调整合专有数据的能力。
Roese表示:“你实际上是在建立一支由具有不同技能的人组成的团队”,这使得人类和AI之间能够采取一种更具协作性的方法,人类可以协调和监督这些数字代理的工作。
Roese预计,代理架构将随着标准化程度的提高而变得更加主流,从而推动企业从2025年中期开始采用面向代理的AI系统,“这可能是我们第一次看到企业AI生产显著加速,”他说。
在谈到数据泄露和代理管理方面的担忧时,Roese表示,不同类型的代理将需要不同的生命周期管理方法。
例如,具有稳定且特定任务的代理,可以像更新软件包一样进行管理,而与动态实时数据交互的代理,则应该使用RAG来访问数据,而不是将数据嵌入代理本身。
为了更好地控制和解释,组织还可以使用一组专门的代理,而不是单个的整体代理。集合中的每个代理都可以拥有针对特定功能量身定制的不同管理生命周期。
例如,在本地机器上运行的通信代理,就可以使用LangChain等工具与单个大型语言模型或者可以访问组织库存实时信息的代理进行通信。“两个代理之间的协作为您提供了看似实时的答案,尽管从生命周期的角度来看,唯一实时的是第二个代理背后的数据库,”Roese说。
他承认企业在驾驭复杂AI方面面临的挑战,并指出其中的主要障碍就是治理、“随机供应商”对推动大多数AI项目的业务部门所带来的影响,以及对可预测成本的需求。
尽管如此,Roese仍然对未来持乐观态度,建议企业应该专注于符合其核心竞争力的战略性AI实施,并利用现成的工具,“随着你实施更好的治理,事情变得更加现成,你实际上可以更快速地行动起来。”
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。