美国的技术制裁以及供应链对 Nvidia 最新设备机架的准备情况,可能会导致 2025 年 AI 服务器销售降温。
台湾市场研究机构 TrendForce 表示,在云服务提供商 (CSPs) 订单的推动下,去年 AI 配置系统的出货量增长了 46%。
Synergy Research Group 上月发布的数据也印证了这一趋势,显示由于预期的 AI 客户需求推动,2024 年公共云基础设施支出激增 48%。服务器制造商富士康也将其最近创纪录的收入增长归功于 AI 服务器的销售。
然而,TrendForce 认为 AI 服务器前景存在一些不确定性,因此对 2025 年提出了几种预测情况。
最有可能的情况是市场将继续扩张,但年增长率会降低——尽管仍可能超过 30%。Microsoft、Meta、Amazon 和 Google 计划增加在云计算和 AI 基础设施方面的资本支出,这预计将维持 AI 服务器需求的一定势头。
TrendForce 认为次可能发生的最坏情况是,AI 服务器出货量增长将放缓至"仅" 20-25%。
影响这一预测的因素包括美国可能对向中国出口 AI 芯片实施更严格的管制,从而增加市场不确定性。此外,由于设计复杂,基于 Grace-Blackwell 超级芯片的 Nvidia 机架系统可能推迟到下半年才能大规模部署。
更乐观的预测假设美国和中国的积极政策(如 Stargate 项目)可能加速 AI 服务器部署。虽然关于 DeepSeek 的揭示可能影响高端 GPU 的采用,但大型云计算公司采购自研芯片的 AI 服务器的速度超出预期。TrendForce 表示,DeepSeek 可能会扩大 AI 的应用,推动边缘 AI 的增长。如果这些因素成真,分析师预计 2025 年 AI 服务器出货量将增长近 35%。
IBM 首席执行官 Arvind Krishna 本月预测,在 DeepSeek 发布后,对 AI 模型开发成本的"清算"将有助于推动该技术的采用。
Krishna 说:"随着成本下降,我们会发现使用量会爆发性增长。这是一个验证——我们一直认为,不需要花费那么多钱就能获得这些模型。"
TrendForce 表示,预计 DeepSeek 的影响将推动云运营商转向成本更低的自研芯片,随着重点从 AI 训练转向推理,针对推理优化的服务器将占据更大的市场份额。
AI 服务器客户市场也可能变得更加细分,大型云计算公司将继续投资高性能解决方案,而企业则会优先考虑更经济的替代方案。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。