基于Arm架构的服务器正在市场上快速崛起,预计2025年出货量将激增70%。然而,这一增长仍远未达到这家芯片设计公司年底前占据全球数据中心CPU销量一半的雄心壮志。
市场研究机构IDC表示,Arm服务器之所以吸引大量关注,主要得益于大规模机架配置系统的推出,如英伟达专为AI处理设计的DGX GB200 NVL72系统。
在最新发布的《全球季度服务器追踪报告》中,IDC预估基于Arm架构的服务器今年将占全球总出货量的21.1%,这与Arm基础设施主管Mohamed Awad在4月份宣称的50%目标相去甚远。
配备至少一个GPU的服务器(有时被称为AI服务器)预计将增长46.7%,几乎占据今年总市场价值的一半。超大规模客户和云服务提供商的快速采用正在推动服务器市场发展,IDC表示该市场规模将在短短三年内增长两倍。
整个服务器市场在2025年第一季度达到创纪录的952亿美元,同比增长134.1%。因此,IDC将全年预测上调至3660亿美元,相当于44.6%的增幅,这将创下历史新高。
"行业标准"x86部分预计在2025年增长39.9%,达到2839亿美元,而非x86系统预计增长更快,同比增长63.7%,预测总额为820亿美元。
IDC的区域市场预测显示,美国将实现最高增长,比2024年跃升59.7%,到2025年底将占总服务器收入的近62%。
中国是另一个销售热点地区,IDC预测增长39.5%,占全球季度收入的21%以上。欧洲、中东和非洲地区以及拉丁美洲的增长率为个位数,分别为7%和0.7%,而加拿大预计今年将下降9.6%,原因是2024年发生了一笔未明确的"超大规模交易"。
IDC全球基础设施研究副总裁Kuba Stolarski在评论服务器增长时表示,对更多计算能力来处理AI的需求可能会持续存在。
"从简单聊天机器人到推理模型再到智能体AI的演进,将需要数个数量级更多的处理能力,特别是在推理方面。"
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。