在接受媒体采访时,Roese描绘了一幅由三个截然不同但相互关联的市场组成的AI格局:预生成式AI、AI模型训练和企业AI。
他指出,虽然前两个市场已经很成熟,但企业AI市场潜力最大,不过采用曲线较慢。他解释说:“AI不是一个单一的市场——是三个完全独立但又相互关联的市场。”他指出,计算机视觉和机器人等生成式AI之前出现的技术,都是把数据提炼为生成式AI可使用格式的关键层。
第二个市场专注于训练大规模AI模型,目前是由超大规模企业以及争夺搜索和社交网络霸主地位的科技巨头主导,而戴尔在提供必要的基础设施方面发挥着关键作用。
然而,Roese认为第三个市场——企业AI——正处于转型的边缘,他指出,虽然训练市场因科技巨头对“大型集群”的大规模投资而成为新闻头条,但企业市场更专注于把AI应用于业务流程中。
“企业AI是关于了解企业中哪些流程使企业运转起来,并通过应用AI来显著改善这些流程”,这就意味着使用AI来优化供应链、改善客户服务和增强产品开发。
Roese认为,一个关键的区别是,企业主要关注推理——通过现有模型运行数据——而不是训练自己的模型,这就需要一种不同的基础设施方法:一种分布式的、针对推理进行优化的、并且可能延伸到边缘的方法。Roese观察到:“在过去六个月中,我们看到企业市场日趋成熟”,他指出,现成的AI工具和功能正在兴起,这些工具和功能针对企业,通常更擅长消费技术而不是生产技术。
六项核心能力
Roese概述了可以解决大多数企业AI用例场景的六项核心能力,并敦促CIO们应该专注于这些基础要素,而不是构建一大堆能力,这将有助于他们优先考虑把AI投资集中在那些直接利用核心能力和竞争优势的领域。
这六项能力包括基于检索增强生成(RAG)的聊天机器人、编码代理、内容AI引擎、数据管理代理、分析代理和微调基础设施。Roese表示,这些功能足以让今天的戴尔实现300多个AI用例。
具体而言,代理AI架构的兴起代表着一个重要的转折点。这些架构由更小的、更专业的AI模型组成,像“数字劳动力”一样执行特定的任务,提供更大的控制力、可解释性、以及通过微调整合专有数据的能力。
Roese表示:“你实际上是在建立一支由具有不同技能的人组成的团队”,这使得人类和AI之间能够采取一种更具协作性的方法,人类可以协调和监督这些数字代理的工作。
Roese预计,代理架构将随着标准化程度的提高而变得更加主流,从而推动企业从2025年中期开始采用面向代理的AI系统,“这可能是我们第一次看到企业AI生产显著加速,”他说。
在谈到数据泄露和代理管理方面的担忧时,Roese表示,不同类型的代理将需要不同的生命周期管理方法。
例如,具有稳定且特定任务的代理,可以像更新软件包一样进行管理,而与动态实时数据交互的代理,则应该使用RAG来访问数据,而不是将数据嵌入代理本身。
为了更好地控制和解释,组织还可以使用一组专门的代理,而不是单个的整体代理。集合中的每个代理都可以拥有针对特定功能量身定制的不同管理生命周期。
例如,在本地机器上运行的通信代理,就可以使用LangChain等工具与单个大型语言模型或者可以访问组织库存实时信息的代理进行通信。“两个代理之间的协作为您提供了看似实时的答案,尽管从生命周期的角度来看,唯一实时的是第二个代理背后的数据库,”Roese说。
他承认企业在驾驭复杂AI方面面临的挑战,并指出其中的主要障碍就是治理、“随机供应商”对推动大多数AI项目的业务部门所带来的影响,以及对可预测成本的需求。
尽管如此,Roese仍然对未来持乐观态度,建议企业应该专注于符合其核心竞争力的战略性AI实施,并利用现成的工具,“随着你实施更好的治理,事情变得更加现成,你实际上可以更快速地行动起来。”
好文章,需要你的鼓励
2025年,企业技术高管面临巨大压力,需要帮助企业从持续的AI投入中获得回报。大多数高管取得了进展,完善了项目优先级排序方法。然而,CIO仍面临AI相关问题。支离破裂的AI监管环境和宏观经济阻力将继续推动技术高管保持谨慎态度。随着AI采用增长的影响不断显现,一些CIO预期明年将带来劳动力策略变化。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
FinOps基金会周四更新了其FinOps开放成本和使用规范云成本管理工具,新版本1.3更好地支持多供应商工作流。该版本新增了合同承诺和协商协议数据集,增加了跨工作负载成本分摊跟踪列,以及云支出和使用报告时效性和完整性的元数据可见性。随着云和AI采用推动企业IT预算增长,技术供应商正在关注将成本与价值联系起来的努力。大型企业通常使用三到四家云供应商,小企业可能使用两家,同时还有数据中心、SaaS和许可等服务。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。