美国的技术制裁以及供应链对 Nvidia 最新设备机架的准备情况,可能会导致 2025 年 AI 服务器销售降温。
台湾市场研究机构 TrendForce 表示,在云服务提供商 (CSPs) 订单的推动下,去年 AI 配置系统的出货量增长了 46%。
Synergy Research Group 上月发布的数据也印证了这一趋势,显示由于预期的 AI 客户需求推动,2024 年公共云基础设施支出激增 48%。服务器制造商富士康也将其最近创纪录的收入增长归功于 AI 服务器的销售。
然而,TrendForce 认为 AI 服务器前景存在一些不确定性,因此对 2025 年提出了几种预测情况。
最有可能的情况是市场将继续扩张,但年增长率会降低——尽管仍可能超过 30%。Microsoft、Meta、Amazon 和 Google 计划增加在云计算和 AI 基础设施方面的资本支出,这预计将维持 AI 服务器需求的一定势头。
TrendForce 认为次可能发生的最坏情况是,AI 服务器出货量增长将放缓至"仅" 20-25%。
影响这一预测的因素包括美国可能对向中国出口 AI 芯片实施更严格的管制,从而增加市场不确定性。此外,由于设计复杂,基于 Grace-Blackwell 超级芯片的 Nvidia 机架系统可能推迟到下半年才能大规模部署。
更乐观的预测假设美国和中国的积极政策(如 Stargate 项目)可能加速 AI 服务器部署。虽然关于 DeepSeek 的揭示可能影响高端 GPU 的采用,但大型云计算公司采购自研芯片的 AI 服务器的速度超出预期。TrendForce 表示,DeepSeek 可能会扩大 AI 的应用,推动边缘 AI 的增长。如果这些因素成真,分析师预计 2025 年 AI 服务器出货量将增长近 35%。
IBM 首席执行官 Arvind Krishna 本月预测,在 DeepSeek 发布后,对 AI 模型开发成本的"清算"将有助于推动该技术的采用。
Krishna 说:"随着成本下降,我们会发现使用量会爆发性增长。这是一个验证——我们一直认为,不需要花费那么多钱就能获得这些模型。"
TrendForce 表示,预计 DeepSeek 的影响将推动云运营商转向成本更低的自研芯片,随着重点从 AI 训练转向推理,针对推理优化的服务器将占据更大的市场份额。
AI 服务器客户市场也可能变得更加细分,大型云计算公司将继续投资高性能解决方案,而企业则会优先考虑更经济的替代方案。
好文章,需要你的鼓励
铠侠正在测试最新的UFS v4.1嵌入式闪存芯片,专为智能手机和平板电脑设计,可提供更快的下载速度和更流畅的设备端AI应用性能。该芯片采用218层TLC 3D NAND技术,提供256GB、512GB和1TB容量选择。相比v4.0产品,随机写入性能提升约30%,随机读取性能提升35-45%,同时功耗效率改善15-20%。新标准还增加了主机发起碎片整理、增强异常处理等功能特性。
上海AI实验室团队提出创新的异步拍摄方案,仅用普通相机就能实现高速4D重建。该方法通过错开相机启动时间将有效帧率从25FPS提升至100-200FPS,并结合视频扩散模型修复稀疏视角导致的重建伪影。实验结果显示,新方法在处理快速运动场景时显著优于现有技术,为低成本高质量4D内容创作开辟新路径。
谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。
上海AI实验室联手复旦大学提出了POLAR方法,这是一种革命性的奖励模型训练技术。通过让AI学会识别不同策略间的差异而非死记评分标准,POLAR在多项任务上实现了显著提升,7B参数模型超越72B现有最强基线,为AI对齐问题提供了全新解决思路。