Gartner最新的全球IT支出预测显示,数据中心系统支出将增长24.1%,是三个月前预期的10%的2倍多,是去年4%实际增幅的6倍——而这一切要都是因为生成式AI。
Gartner杰出副总裁分析师John-David Lovelock是该报告的主要作者。他说,托管服务提供商在针对AI训练的服务器上的支出,是推动这一增长的主要因素,而且这种影响可能会持续几年的时间。
作为一名拥有十年预测经验的资深人士,Lovelock说,即使是他自己,自新冠疫情以来也没有见过如此巨大的变化。他说:“服务器以这种速度增长,我从未见过,也从未想到过。”
供应链问题有所缓解
他说,突然增长的背后有两个因素。在为AI服务器提供动力的GPU市场占据主导地位的Nvidia,已经解决了大部分供应链问题。Lovelock:“现在世界有能力制造出更多针对AI优化的服务器,但我们仍然看到,这些新型生成式AI服务器的订单在6个月到1年时间内会出现积压。”
大型超大规模数据中心企业和许多托管服务提供商“正在尽可能多地购买这些东西,以构建和准备迎接他们看到的新一代AI推理浪潮,”他补充说。
Lovelock表示,随着大型语言模型变得越来越大,并且消耗越来越多的服务器资源,AI训练热潮将在未来至少几年内推动基础服务器支出的增加,下一代模型的生成成本可能高达10亿美元。
Lovelock表示,随着行动转向推理(即让经过训练的模型根据新数据进行预测或决策),需求将保持高位。推理对计算机的依赖程度低于训练,可是,“虽然你只构建了一个模型,但全年都在推理它”。
看不到尽头
Gartner预计,超大规模数据中心企业今年将在云基础设施上花费700亿美元,到2025年将增长到1400亿美元,到2028年将增长到2100亿美元。他说:“我们仍然没有看到这些工具的最终状态”,我们远没有看到一套大型语言模型的商品状态,甚至没有看到大型语言模型应该具备的基本确定功能。”
虽然企业支出不是服务器支出增长的主要因素,但企业数据中心并非完全不受影响。Lovelock说:“云提供商的服务器增幅在40%到60%之间,而企业的增幅在20%左右,大多数CIO仍处于起跑线上,他们想知道这些工具能做什么。”
IT经济的其他板块预计将大致保持过去的增长模式。设备支出预计今年将增长5.4%,而去年下降了6.5%。软件将保持12.6%的健康增长,服务业将增长7.1%,但基数比软件和数据中心行业的总和还要大。
Gartner指出,尽管软件公司正争相在其产品中添加生成式AI功能,但大多数公司尚未能够从新功能中获利。Gartner表示,如今的生成式AI更像是一种税收,而不是增值功能。
“为了销售产品并保持市场地位,软件供应商需要在2025年底之前拥有生成式AI功能,这样任何人都不会有充足的时间开发AI模型,所以大多数人会去找已经拥有模型的人。”
实际上,增加AI功能带来的任何额外收入都将流回运营模型的公司。他说,生成式AI“可能是亏本销售或收支平衡的一项提议,直到我们能够知道生成式AI在哪里增加了价值,知道的越多,他们就越能够根据交付的价值定价。”
全球IT支出预测(单位:百万美元)
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。