整个世界正为生成式AI而疯狂,且疯狂程度仍在与日俱增。到2027年,全球GPU硬件总支出将达到4000亿美元。
如果大家觉得这个数字也不是很夸张,那我们不妨拿美国国防部做个对比。作为地球上烧钱能力最强的机构,国防部截至明年7月的2024政府财政年度总预算也就是8420亿美元。
还有更多相关观点。Gartner IT市场分析师们预计到2024年,包括硬件、软件、IT服务和电信服务在内的全球IT总支出将达到5.13万亿美元,同比增长8.8%。其中,预计只有2355亿美元用于数据中心系统,涵盖世界各地销售的全部服务器、存储和交换机设备。这部分数字增幅为8.1%,而我们认为这很大程度上要归功于生成式AI相关集群的快速落地。甚至如果不算这部分新增需求,传统数据中心内的通用基础设施支出反而出现了严重下滑。
今年10月,我们根据IDC的服务器收支预测整理出电子表格,想要弄清到底有多少钱被花在了AI集群身上。从结果来看,IDC发现2022年AI系统的总销售额还在区区100亿美元以内,但在短短两年之后的2023年,这一数字就会迅速飙升至500亿美元,到2027年稳定增长至1000亿美元,直接在服务器总收入中占据半壁江山。坦率地讲,这样的势头绝对堪称疯狂。
而如果AMD公司CEO苏姿丰在本周于圣何塞召开的Advancing AI大会上做出的预测属实,那么AI增长模型似乎还要调整得更激进一些。苏姿丰提到,数据中心GPU市场已经迈过发展临界点,而巨大的宏观经济压力则会为其再添一股增压势能。(顺带一提,生成式AI的广泛普及也让可控核聚变在内的清洁能源成为关注焦点,这不仅有助于通过多种方式恢复地球环境、扭转人类过往发展造成的损害,同时也将开辟出新的商业空间。)
一年之前,苏姿丰团队在首次谈及MI300系列GPU的设计愿景时,就已经认真总结过市场研究和业务渠道,并认为数据中心GPU在2023年的总潜在市场大约是300亿美元左右,而接下来直到2027年将保持50%左右的年均复合增长率,届时发展至1500亿美元以上。
苏姿丰当时在主题演讲中坦言,“这看上去是个很大的数字。”考虑到当时IDC和Gartner等咨询公司发布的全球数据中心硬件支出预测,大多数人的确很难相信这个看似过度乐观的结论。
“但纵观过去十二个月间发生的一切,以及我们在各个行业、各家客户以及全球各地观察到的技术采用率和部署节奏,就会意识到需求的增长速度的确极快。因此从建立AI基础设施的角度来看——当然,目前一切先从云端起始,但随后将逐步渗透进企业——我们相信,我们将在整个嵌入式市场和个人计算领域看到大量AI要素。我们预计数据中心加速器TAM将在未来四年内以每年70%以上的速度增长,到2027年将超过4000亿美元。哪怕是对我们这些在行业内见惯了大起大落的从业者来说,这样的创新步伐也超过了我们以往的任何经历。”
而且,这里所说的还只是数据中心AI加速器业务中的TAM部分,尚未涵盖边缘/客户端AI硬件加速器TAM。AMD并没有讨论TAM对于整体芯片市场意味着什么。但就在IDC于几个月前预计2027年全球服务器业务将接近2000亿美元时,外界还普遍对这个巨大的数字表示难以置信。
但如果逆向计算,并选择一个比较可靠的比率(即AI服务器的GPU成本约为设备总价的53%,就是说基于八路英伟达HGX GPU计算复合体的设备总价为37.5万美元,其中GPU部分的成本约为20万美元),而且假设IDC对于服务器市场以及AI/非AI服务器之间的此消彼长趋势预测正确,那么到2027年,AI加速器硬件所对应的GPU销售总额大约会在500亿美元左右。这明显跟AMD的结论对不上,除非AMD所说的“数据中心AI加速器”有着更加广泛的定义范围,比如说不仅包含GPU和NNP,甚至连CPU的部分也被计算了进来。
无论如何,AMD表示增长速度的确高于预期,加速器的收入表现也比我们几个月前的预测高出了9倍。
但如此疯狂的市场终归不能持久。假设GPU和其他加速器的价格伴随HBM内存成本的降低而同步下调,那么按照苏姿丰团队给出的总销售额计算,对应的硬件出货量将极为巨大。而在这波商业浪潮之下,相信将会有更多厂商占据住自己的一片竞争与利润空间。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。