基于Arm架构的服务器正在市场上快速崛起,预计2025年出货量将激增70%。然而,这一增长仍远未达到这家芯片设计公司年底前占据全球数据中心CPU销量一半的雄心壮志。
市场研究机构IDC表示,Arm服务器之所以吸引大量关注,主要得益于大规模机架配置系统的推出,如英伟达专为AI处理设计的DGX GB200 NVL72系统。
在最新发布的《全球季度服务器追踪报告》中,IDC预估基于Arm架构的服务器今年将占全球总出货量的21.1%,这与Arm基础设施主管Mohamed Awad在4月份宣称的50%目标相去甚远。
配备至少一个GPU的服务器(有时被称为AI服务器)预计将增长46.7%,几乎占据今年总市场价值的一半。超大规模客户和云服务提供商的快速采用正在推动服务器市场发展,IDC表示该市场规模将在短短三年内增长两倍。
整个服务器市场在2025年第一季度达到创纪录的952亿美元,同比增长134.1%。因此,IDC将全年预测上调至3660亿美元,相当于44.6%的增幅,这将创下历史新高。
"行业标准"x86部分预计在2025年增长39.9%,达到2839亿美元,而非x86系统预计增长更快,同比增长63.7%,预测总额为820亿美元。
IDC的区域市场预测显示,美国将实现最高增长,比2024年跃升59.7%,到2025年底将占总服务器收入的近62%。
中国是另一个销售热点地区,IDC预测增长39.5%,占全球季度收入的21%以上。欧洲、中东和非洲地区以及拉丁美洲的增长率为个位数,分别为7%和0.7%,而加拿大预计今年将下降9.6%,原因是2024年发生了一笔未明确的"超大规模交易"。
IDC全球基础设施研究副总裁Kuba Stolarski在评论服务器增长时表示,对更多计算能力来处理AI的需求可能会持续存在。
"从简单聊天机器人到推理模型再到智能体AI的演进,将需要数个数量级更多的处理能力,特别是在推理方面。"
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。