在接受媒体采访时,Roese描绘了一幅由三个截然不同但相互关联的市场组成的AI格局:预生成式AI、AI模型训练和企业AI。
他指出,虽然前两个市场已经很成熟,但企业AI市场潜力最大,不过采用曲线较慢。他解释说:“AI不是一个单一的市场——是三个完全独立但又相互关联的市场。”他指出,计算机视觉和机器人等生成式AI之前出现的技术,都是把数据提炼为生成式AI可使用格式的关键层。
第二个市场专注于训练大规模AI模型,目前是由超大规模企业以及争夺搜索和社交网络霸主地位的科技巨头主导,而戴尔在提供必要的基础设施方面发挥着关键作用。
然而,Roese认为第三个市场——企业AI——正处于转型的边缘,他指出,虽然训练市场因科技巨头对“大型集群”的大规模投资而成为新闻头条,但企业市场更专注于把AI应用于业务流程中。
“企业AI是关于了解企业中哪些流程使企业运转起来,并通过应用AI来显著改善这些流程”,这就意味着使用AI来优化供应链、改善客户服务和增强产品开发。
Roese认为,一个关键的区别是,企业主要关注推理——通过现有模型运行数据——而不是训练自己的模型,这就需要一种不同的基础设施方法:一种分布式的、针对推理进行优化的、并且可能延伸到边缘的方法。Roese观察到:“在过去六个月中,我们看到企业市场日趋成熟”,他指出,现成的AI工具和功能正在兴起,这些工具和功能针对企业,通常更擅长消费技术而不是生产技术。
六项核心能力
Roese概述了可以解决大多数企业AI用例场景的六项核心能力,并敦促CIO们应该专注于这些基础要素,而不是构建一大堆能力,这将有助于他们优先考虑把AI投资集中在那些直接利用核心能力和竞争优势的领域。
这六项能力包括基于检索增强生成(RAG)的聊天机器人、编码代理、内容AI引擎、数据管理代理、分析代理和微调基础设施。Roese表示,这些功能足以让今天的戴尔实现300多个AI用例。
具体而言,代理AI架构的兴起代表着一个重要的转折点。这些架构由更小的、更专业的AI模型组成,像“数字劳动力”一样执行特定的任务,提供更大的控制力、可解释性、以及通过微调整合专有数据的能力。
Roese表示:“你实际上是在建立一支由具有不同技能的人组成的团队”,这使得人类和AI之间能够采取一种更具协作性的方法,人类可以协调和监督这些数字代理的工作。
Roese预计,代理架构将随着标准化程度的提高而变得更加主流,从而推动企业从2025年中期开始采用面向代理的AI系统,“这可能是我们第一次看到企业AI生产显著加速,”他说。
在谈到数据泄露和代理管理方面的担忧时,Roese表示,不同类型的代理将需要不同的生命周期管理方法。
例如,具有稳定且特定任务的代理,可以像更新软件包一样进行管理,而与动态实时数据交互的代理,则应该使用RAG来访问数据,而不是将数据嵌入代理本身。
为了更好地控制和解释,组织还可以使用一组专门的代理,而不是单个的整体代理。集合中的每个代理都可以拥有针对特定功能量身定制的不同管理生命周期。
例如,在本地机器上运行的通信代理,就可以使用LangChain等工具与单个大型语言模型或者可以访问组织库存实时信息的代理进行通信。“两个代理之间的协作为您提供了看似实时的答案,尽管从生命周期的角度来看,唯一实时的是第二个代理背后的数据库,”Roese说。
他承认企业在驾驭复杂AI方面面临的挑战,并指出其中的主要障碍就是治理、“随机供应商”对推动大多数AI项目的业务部门所带来的影响,以及对可预测成本的需求。
尽管如此,Roese仍然对未来持乐观态度,建议企业应该专注于符合其核心竞争力的战略性AI实施,并利用现成的工具,“随着你实施更好的治理,事情变得更加现成,你实际上可以更快速地行动起来。”
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。