关于CPU的讨论往往围绕一种指令集架构与另一种的对比——x86与Arm、Arm与RISC-V等等。然而,在单一系统中使用多种CPU架构已成为常见做法,无论是单一片上系统(SoC)还是更大的电子平台,如PC、汽车甚至数据中心。纵观电子产业历史,从未存在过单一CPU架构选项,因为没有两种处理工作负载是完全相同的。
每种架构在软件支持、复杂性、灵活性、功耗和成本方面都有其优势和劣势。因此,利用多种CPU架构来处理不同工作负载或功能已成为通行做法,就如同使用不同加速器——数字信号处理器(DSP)、图形处理单元(GPU)、神经处理单元(NPU)和现场可编程门阵列(FPGA)来执行特定功能一样。而且CPU或加速器的选择会随着行业趋势而变化,没有哪个趋势比人工智能(AI)更具颠覆性。
AI正在改变行业对计算的构想。它要求性能功耗比呈指数级增长,从最大的云服务器到最小的嵌入式设备都是如此。这推动了规模、效率、灵活性和对不断变化的开源优先软件生态系统支持方面的新动态。因此,从硅片到服务提供商的整个行业都在寻找独特解决方案,这些方案往往包含不同的架构。
计算的演进
在计算的早期年代,x86是首选架构,由英特尔开发,AMD和英特尔共同推进。两家公司最终在2024年开始合作开发未来的ISA增强功能,以确保前向兼容性和软件支持。虽然x86仍然是PC和通用服务器的主导架构,但它现在与日益增长的RISC(精简指令集计算机)架构生态系统共存,通常在同一系统或SoC内。许多x86 SoC集成了用于安全、AI和电源管理的辅助RISC核心。x86架构的一个关键优势是大多数PC和服务器应用程序都是为它设计的,提供了软件兼容性的传承。x86架构也用于许多嵌入式应用,但规模远小于其他更节能的架构。
就应用和数量而言,领先的处理架构是Arm。Arm是移动设备、消费应用/物联网、汽车以及几乎所有其他领域的主要架构。虽然Arm架构最初因其小尺寸和性能效率而具有吸引力,但它现在拥有最大的硬件和软件生态系统。
Arm最初取代了早期的嵌入式CPU架构,如MIPS和摩托罗拉的68k和88k CPU。在1990年代和2000年代初,Arm成为嵌入式处理的领先RISC架构,应用范围从无线控制器到从定制专用集成电路(ASIC)到x86处理器中所有设备的特定处理功能单元。到2000年代末,Arm取代了数据中心应用中使用的许多其他架构,如SPARC和PowerPC,包括网络和存储。在过去十年中,Arm解决了许多软件兼容性挑战,使其成为PC和服务器中x86的可信替代方案。
Arm架构现在为所有苹果PC、越来越多的Windows PC、来自Ampere、富士通、华为、英伟达的许多服务器处理器以及超大规模服务提供商开发的所有定制处理器提供动力,包括阿里巴巴、亚马逊、谷歌、Meta、微软和腾讯。相比之下,2024年出货了2.5亿到3亿颗x86处理器(其中一些带有嵌入式RISC核心),而估计出货了290亿颗Arm处理器,在云和数据中心应用中的份额不断增加。
第三种处理器架构是RISC-V,这是一个任何人都可以使用和修改的开源ISA。虽然RISC-V正在从微控制器(MCU)到AI加速器的各个领域得到探索,但2024年出货的大约10亿颗核心中大多数是深度嵌入式实现。RISC-V核心在最大的x86和Arm处理器供应商英特尔和高通的处理器中用于特定的MCU类功能。然而,它也与其他CPU和DSP架构竞争,如新思科技的Arc、Cadence的Tensilica和MIPS。虽然对RISC-V架构有巨大兴趣,但软件工具和支持仍落后于Arm和x86。RISC-V非常像早期的Arm,当时它与MIPS和摩托罗拉竞争,它仍在构建生态系统和原生软件支持的过程中。然而,RISC-V的开放许可允许在ISA级别进行完全定制,使其对定制嵌入式功能具有吸引力。
其他架构继续存在,尽管应用更加有限。Power是PowerPC架构在高性能大型机方面的演进,仍在IBM的开发和使用中。Sun Microsystems开发的SPARC架构仍用于一些服务器和航天应用。MIPS仍用于一些MCU应用。即使在这些细分领域,看到结合多种架构的异构系统也越来越常见。
向多架构转变
利用多种CPU架构的单一解决方案的最新例子之一是Synaptics的L2600系列边缘AI SoC。虽然Arm是整个SoC中使用的主要架构,但它也包括谷歌开发的基于RISC-V的Coral NPU用于AI处理。据Synaptics称,双架构策略的原因是Linux就在Arm上运行,而RISC-V提供了一个开源解决方案,可能克服当今边缘设备SoC中使用的不同NPU之间的分化。
每家公司和架构都在快速发展以满足AI时代的需求。RISC-V硬件和软件生态系统继续发展。AMD和英特尔已开始为各种性能级别开发不同的x86 CPU核心,为服务器提供更多SoC配置,并为大客户提供某种程度的定制。
Arm在其广泛的CPU核心、GPU核心和系统IP组合中增加了完整的预验证计算子系统(CSS),并通过Arm Total Design构建行业级芯片生态系统,以支持更广泛的芯片采用和创建更多异构计算解决方案。此外,Arm生态系统中的许多行业领导者继续通过定制Arm兼容CPU设计进行创新,这些设计满足特定应用对最高性能效率水平的需求。即使由此产生的SoC通常也使用定制和标准Arm CPU核心的混合。
未来是异构的
随着半导体行业努力满足AI的性能效率需求并过渡到基于芯片的未来处理器和SoC,在同一芯片设计中使用多种CPU架构可能会变得更加普遍。虽然芯片目前主要用于高端计算机应用,但它们最终将扩展到嵌入式应用。在AI和芯片时代,问题不再是哪种CPU架构会获胜,而是它们将如何协同工作。
Q&A
Q1:为什么现代系统需要使用多种CPU架构?
A:因为没有两种处理工作负载是完全相同的,每种架构在软件支持、复杂性、灵活性、功耗和成本方面都有其优势和劣势。因此利用多种CPU架构来处理不同工作负载或功能已成为通行做法,就如同使用不同加速器来执行特定功能一样。
Q2:目前主流的CPU架构有哪些?各有什么特点?
A:主要有三种:x86架构主要用于PC和通用服务器,拥有强大的软件兼容性;Arm架构是移动设备、消费应用、汽车等领域的主导,拥有最大的硬件和软件生态系统;RISC-V是开源架构,允许完全定制,主要用于嵌入式应用。
Q3:AI时代对CPU架构发展有什么影响?
A:AI正在改变行业对计算的构想,要求性能功耗比呈指数级增长。这推动了新的技术动态,整个行业都在寻找包含不同架构的独特解决方案。在AI和芯片时代,问题不再是哪种CPU架构会获胜,而是它们将如何协同工作。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。