Gartner最新的全球IT支出预测显示,数据中心系统支出将增长24.1%,是三个月前预期的10%的2倍多,是去年4%实际增幅的6倍——而这一切要都是因为生成式AI。
Gartner杰出副总裁分析师John-David Lovelock是该报告的主要作者。他说,托管服务提供商在针对AI训练的服务器上的支出,是推动这一增长的主要因素,而且这种影响可能会持续几年的时间。
作为一名拥有十年预测经验的资深人士,Lovelock说,即使是他自己,自新冠疫情以来也没有见过如此巨大的变化。他说:“服务器以这种速度增长,我从未见过,也从未想到过。”
供应链问题有所缓解
他说,突然增长的背后有两个因素。在为AI服务器提供动力的GPU市场占据主导地位的Nvidia,已经解决了大部分供应链问题。Lovelock:“现在世界有能力制造出更多针对AI优化的服务器,但我们仍然看到,这些新型生成式AI服务器的订单在6个月到1年时间内会出现积压。”
大型超大规模数据中心企业和许多托管服务提供商“正在尽可能多地购买这些东西,以构建和准备迎接他们看到的新一代AI推理浪潮,”他补充说。
Lovelock表示,随着大型语言模型变得越来越大,并且消耗越来越多的服务器资源,AI训练热潮将在未来至少几年内推动基础服务器支出的增加,下一代模型的生成成本可能高达10亿美元。
Lovelock表示,随着行动转向推理(即让经过训练的模型根据新数据进行预测或决策),需求将保持高位。推理对计算机的依赖程度低于训练,可是,“虽然你只构建了一个模型,但全年都在推理它”。
看不到尽头
Gartner预计,超大规模数据中心企业今年将在云基础设施上花费700亿美元,到2025年将增长到1400亿美元,到2028年将增长到2100亿美元。他说:“我们仍然没有看到这些工具的最终状态”,我们远没有看到一套大型语言模型的商品状态,甚至没有看到大型语言模型应该具备的基本确定功能。”
虽然企业支出不是服务器支出增长的主要因素,但企业数据中心并非完全不受影响。Lovelock说:“云提供商的服务器增幅在40%到60%之间,而企业的增幅在20%左右,大多数CIO仍处于起跑线上,他们想知道这些工具能做什么。”
IT经济的其他板块预计将大致保持过去的增长模式。设备支出预计今年将增长5.4%,而去年下降了6.5%。软件将保持12.6%的健康增长,服务业将增长7.1%,但基数比软件和数据中心行业的总和还要大。
Gartner指出,尽管软件公司正争相在其产品中添加生成式AI功能,但大多数公司尚未能够从新功能中获利。Gartner表示,如今的生成式AI更像是一种税收,而不是增值功能。
“为了销售产品并保持市场地位,软件供应商需要在2025年底之前拥有生成式AI功能,这样任何人都不会有充足的时间开发AI模型,所以大多数人会去找已经拥有模型的人。”
实际上,增加AI功能带来的任何额外收入都将流回运营模型的公司。他说,生成式AI“可能是亏本销售或收支平衡的一项提议,直到我们能够知道生成式AI在哪里增加了价值,知道的越多,他们就越能够根据交付的价值定价。”
全球IT支出预测(单位:百万美元)

好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。