自从过去两年成为主流以来,AI迅速改变了芯片行业,推动了对专用处理器的需求,加速了设计创新,重塑了全球供应链和市场。
从OpenAI在2022年底发布ChatGPT开始,生成式AI掀起的革命持续突破着AI推理、大型语言模型(LLM)和半导体技术的极限。很快,传统CPU就无法满足AI的并行处理需求,于是让位给专用芯片:GPU、TPU、NPU和AI加速器。
这促使Nvidia、AMD和英特尔等公司扩大自身的产品组合(包括针对AI优化的产品),其中Nvidia在用于AI训练和推理的GPU方面处于领先地位。而且,由于AI工作负载优先考虑吞吐量、能源效率和可扩展性,大型科技行业在数据中心方面投入了大量资金,Nvidia H100和AMD MI300等专注于AI的芯片,现在已经成为了AI云计算的支柱。
与此同时,亚马逊、微软和谷歌等公司开发了定制芯片如AWS Graviton和Google TPU,以减少对外部供应商的依赖并提高AI的性能。
特别是,这场AI革命也推动了Nvidia的增长,使其成为数据中心市场的主导力量。Nvidia曾经专注于生产游戏系统芯片,而现在Nvidia驱动的硬件和软件的发展速度超过了游戏芯片,从而带来了显著的财务收益。2023年5月,Nvidia的市值突破1万亿美元,并在2024年6月超过3.3万亿美元,成为当时全球最有价值的公司。
然而,AI芯片行业即将发生巨大的变化。在过去几年中,半导体开发商和制造商一直专注于满足超大规模云服务提供商(如AWS、Google Cloud Platform和微软Azure)的数据中心需求;企业组织在内部AI开发方面严重依赖这些行业巨头。
现在,人们开始转向仅使用内部公司数据的小型AI模型,从而实现更安全、更可定制的生成式AI应用和AI代理。与此同时,边缘AI正在占据主导地位,因为它允许在设备(包括PC、智能手机、车辆和物联网设备)上进行AI处理,从而减少对云基础设施的依赖,刺激对高效、低功耗芯片的需求。
市场研究公司IDC副总裁Mario Morales表示:“挑战在于,如果你要将AI带给大众,你就必须改变构建解决方案的方式;我认为这就是Nvidia面临的挑战,因为你不能使用大型的、复杂的GPU来解决端点问题。因此,那些新公司将有机会进入这个市场,包括高通、意法半导体、瑞萨电子、安霸等公司都拥有大量技术,但现在的问题是如何使用这些技术。”
“这就是AI的下一个前沿——边缘,”Morales说。
一些芯片制造商面对的市场动荡
尽管2023年全球半导体芯片销售额下降了约11%,从上一年创纪录的5741亿美元降至约5340亿美元,但这种低迷并没有持续下去。Morales表示,受AI应用、个人电脑和智能手机销售稳定推动,预计到2025年销售额将增长22%。
Morales表示:“如果你正在制造内存或者AI加速器,比如Nvidia、Broadcom、AMD甚至Marvel,那么你的表现非常好。但如果你是一家半导体公司,比如ST Micro、Infinium、Renesas或者Texas Instruments,那么你就会受到库存过剩和工业和汽车行业宏观经济不确定性的严重打击。去年这两个市场表现优异,但今年受到的打击非常严重。”
Morales表示,目前大多数大型语言模型都依赖于公共数据,但全球80%以上的数据由不会与OpenAI或Anthropic等平台共享数据的企业持有。这一趋势有利于处理器公司,尤其是Nvidia、高通和AMD。随着组织将这项技术引入内部,价格更低、能效更高、高度专业化的片上系统(SoC)技术将开始占据市场的主导地位。
“我认为这肯定会改变市场的动态,这就是为什么你会看到有很多公司联合起来,用他们的技术解决边缘和终端问题。我认为,这就是未来你将和企业一起看到的下一波增长;企业正在采用自己的数据中心方法。”
英特尔将继续在个人电脑领域为自己的处理器寻找避风港,而把制造外包给台积电的决定,使保持了相对于竞争对手AMD的竞争力。但英特尔很可能难以跟上新兴市场其他芯片制造商的步伐。
“除此之外,如果你看看他们的数据中心业务,会发现他们的市场份额仍在输给AMD,而且他们对Nvidia束手无策,”Morales说。
虽然英特尔最新的x86和Gaudi AI加速器系列旨在与Nvidia H100和Blackwell GPU竞争,但Morales认为,它们更像是一种“权宜之计”——而不是市场所寻求的。
“我确实相信,在客户端,随着AI逐渐进入个人电脑领域,英特尔有机会把更新周期利用起来,他们刚刚获得来自微软Copilot的背书,这为他们的x86产品线提供了一个机会;英特尔可以继续战斗,直到他们从转型和企业发生的所有变化中恢复过来。”
标普全球评级技术总监Andrew Chang表示,为了在现代数据中心保持相关性——Nvidia的芯片正在推动增长——英特尔和AMD将需要投资GPU。
Change说:“虽然CPU仍然必不可少,但Nvidia主导着AI芯片市场,让AMD和英特尔难以竞争。AMD的目标是到2025年实现50亿美元的AI芯片销售额,而英特尔以Gaudi平台为中心的AI策略微乎其微。两家公司将继续投资GPU和AI加速器,实现一些增量的收入增长,但在数据中心市场的份额可能会继续下降。”
政治因素、《芯片法案》以及1月20日之后会发生什么
出口限制、供应链中断和政府政策等地缘政治和经济因素也可能重塑芯片行业。1月20日就职的当选总统的特朗普已表示计划对芯片进口征收高额关税。
《CHIPS and Science Act》还承诺向在美国开展业务的半导体开发商和制造商提供数十亿美元的资金。根据该法案,已经为包括台积电、英特尔、三星和美光在内的多家公司拨出390亿美元的资金,所有这些公司都已经制定计划或者正在建设新的制造或研究设施。
但为了分配税款,每家公司都必须达到特定的里程碑;在此之前,这些资金仍未动用。虽然数十亿美元的激励措施无疑有助于美国芯片生产回流,但Morales指出,《芯片法案》的25%税收减免是更大的好处。
“即使是像英特尔这样的公司……也能获得约500亿美元的税收减免,这是闻所未闻的。这就是回报,”他说。
尽管特朗普已经暗示政府资助鼓励回流是错误的策略,但业内专家并不认为他重新上任后《芯片法案》会被大幅削减。“我们预计《芯片法案》将进行适度修改,但不会像削减尚未分配的资金那样大刀阔斧,”莫拉莱斯说。“《芯片法案》得到了两党的支持,任何修改该法案的尝试都会遭到亚利桑那州和俄亥俄州等受益州的反对。”
迄今为止,为耗能型云数据中心供电的高端处理器占据了市场主导地位,但用于边缘设备的节能AI处理器可能会继续受到青睐。
Morales说:“想想今年的AI PC或集成AI的智能手机,甚至可穿戴设备,它拥有更小、更优化的模型,都可以利用AI推理。这是我们下一步要做的事情,我认为未来几年它会变得非常重要。
“而且,我认为AI推理在公司中所占的比例将与我们目前在数据中心看到的一样大,甚至更大,”他补充道。
从LLM到SLM和边缘设备
企业和其他组织也在把重点从单一AI模型转移到多模态AI,或能够处理和集成多种类型数据或“模态”的大型语言模型,例如文本、图像、音频、视频和感官输入。来自不同资源的输入可以更全面地理解这些数据,提高跨任务的性能。
根据标普全球的一份报告,超过80%的组织预计他们的AI工作流程将在未来两年内增加,而约三分之二的组织预计将面临升级IT基础设施的压力。
标普全球评级首席创新官Sudeep Kesh指出,AI正在向更小型、特定任务的模型发展,但更大型的通用模型仍将必不可少。“两种类型将共存,在每个领域创造机会,”他说。
一个关键挑战将是开发计算和节能模型,影响芯片的设计和实现。Kesh表示,芯片制造商还需要解决可扩展性、互操作性和系统集成问题——所有这些都有望推动整个行业的技术进步,改进自主系统,实现边缘AI等未来发展。
特别是,随着很多公司放弃了基于云的大型语言模型,转而采用可以部署在边缘设备和端点上的更小型的语言模型,行业对AI推理的兴趣将日益增加。
Morales说:“对于行业来说,这是一个盛宴或饥荒的环境,来年会发生什么?我认为我们在数据中心看到的增长是惊人的,而且这种增长将持续到2025年。令我兴奋的是,企业开始考虑优先在AI方面投入IT资金,这将引发对处理器的第二波需求。”
好文章,需要你的鼓励
微软计划在本财年投资 800 亿美元建设数据中心,以支持人工智能发展。这一巨额投资凸显了 AI 基础设施建设的资本密集性。微软将在美国境内投入超过一半资金,并呼吁政府制定平衡安全与创新的政策,以保持美国在 AI 领域的领先地位。
根据 GSMA 的研究,卫星通信市场近三个月发展迅速。各轨道卫星容量增加,商业服务可用性提高,企业采用率随之上升。研究显示,99 家全球通信运营商提供卫星服务,其中 19 家已上线,80 家正在规划或测试中。市场呈现三大趋势:运营商为 2025 年发射做准备、Apple 加大对 Globalstar 投资,以及卫星在企业规划中的重要性提升。
据报道,以太坊层 2 区块链开发商 Movement Labs 正在进行 1 亿美元 B 轮融资,估值约 30 亿美元。该公司基于 Facebook 的 Move 语言虚拟机开发了一个以太坊层 2 解决方案,旨在提高交易速度、降低成本,并增强智能合约的安全性。这轮融资反映了市场对高效区块链基础设施的需求和信心。
微软发布了名为 Phi-4 的小型语言模型的开源代码。该模型具有 140 亿参数,能够生成文本和解决数学问题。经过内部评估,Phi-4 在某些基准测试中的表现优于参数量是其 5 倍的大型模型。这一举动加入了科技巨头开源小型语言模型的潮流中。