在接受媒体采访时,Roese描绘了一幅由三个截然不同但相互关联的市场组成的AI格局:预生成式AI、AI模型训练和企业AI。
他指出,虽然前两个市场已经很成熟,但企业AI市场潜力最大,不过采用曲线较慢。他解释说:“AI不是一个单一的市场——是三个完全独立但又相互关联的市场。”他指出,计算机视觉和机器人等生成式AI之前出现的技术,都是把数据提炼为生成式AI可使用格式的关键层。
第二个市场专注于训练大规模AI模型,目前是由超大规模企业以及争夺搜索和社交网络霸主地位的科技巨头主导,而戴尔在提供必要的基础设施方面发挥着关键作用。
然而,Roese认为第三个市场——企业AI——正处于转型的边缘,他指出,虽然训练市场因科技巨头对“大型集群”的大规模投资而成为新闻头条,但企业市场更专注于把AI应用于业务流程中。
“企业AI是关于了解企业中哪些流程使企业运转起来,并通过应用AI来显著改善这些流程”,这就意味着使用AI来优化供应链、改善客户服务和增强产品开发。
Roese认为,一个关键的区别是,企业主要关注推理——通过现有模型运行数据——而不是训练自己的模型,这就需要一种不同的基础设施方法:一种分布式的、针对推理进行优化的、并且可能延伸到边缘的方法。Roese观察到:“在过去六个月中,我们看到企业市场日趋成熟”,他指出,现成的AI工具和功能正在兴起,这些工具和功能针对企业,通常更擅长消费技术而不是生产技术。
六项核心能力
Roese概述了可以解决大多数企业AI用例场景的六项核心能力,并敦促CIO们应该专注于这些基础要素,而不是构建一大堆能力,这将有助于他们优先考虑把AI投资集中在那些直接利用核心能力和竞争优势的领域。
这六项能力包括基于检索增强生成(RAG)的聊天机器人、编码代理、内容AI引擎、数据管理代理、分析代理和微调基础设施。Roese表示,这些功能足以让今天的戴尔实现300多个AI用例。
具体而言,代理AI架构的兴起代表着一个重要的转折点。这些架构由更小的、更专业的AI模型组成,像“数字劳动力”一样执行特定的任务,提供更大的控制力、可解释性、以及通过微调整合专有数据的能力。
Roese表示:“你实际上是在建立一支由具有不同技能的人组成的团队”,这使得人类和AI之间能够采取一种更具协作性的方法,人类可以协调和监督这些数字代理的工作。
Roese预计,代理架构将随着标准化程度的提高而变得更加主流,从而推动企业从2025年中期开始采用面向代理的AI系统,“这可能是我们第一次看到企业AI生产显著加速,”他说。
在谈到数据泄露和代理管理方面的担忧时,Roese表示,不同类型的代理将需要不同的生命周期管理方法。
例如,具有稳定且特定任务的代理,可以像更新软件包一样进行管理,而与动态实时数据交互的代理,则应该使用RAG来访问数据,而不是将数据嵌入代理本身。
为了更好地控制和解释,组织还可以使用一组专门的代理,而不是单个的整体代理。集合中的每个代理都可以拥有针对特定功能量身定制的不同管理生命周期。
例如,在本地机器上运行的通信代理,就可以使用LangChain等工具与单个大型语言模型或者可以访问组织库存实时信息的代理进行通信。“两个代理之间的协作为您提供了看似实时的答案,尽管从生命周期的角度来看,唯一实时的是第二个代理背后的数据库,”Roese说。
他承认企业在驾驭复杂AI方面面临的挑战,并指出其中的主要障碍就是治理、“随机供应商”对推动大多数AI项目的业务部门所带来的影响,以及对可预测成本的需求。
尽管如此,Roese仍然对未来持乐观态度,建议企业应该专注于符合其核心竞争力的战略性AI实施,并利用现成的工具,“随着你实施更好的治理,事情变得更加现成,你实际上可以更快速地行动起来。”
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。