Arm基础设施事业部全球副总裁 邹挺
“Software is eating the world”,软件正在改变世界,而为了适应多微处理器的新环境,软件自身也需要变革。
从数据中心到汽车及工厂,万物都在被重新设计为软件定义的模式。同时,硬件的“专用处理”趋势——即以独特的创造性方式将 CPU、GPU、DPU 和其他组件组合在一起,并通过调整缓存大小、速度、I/O和其他属性对其进行艺术与科学的优化,已成为继摩尔定律后的又一创新推动因素。专用处理是以应用场景为依据,根据不同场景提供最适切的计算处理能力,这将改变软件开发者的常规工作方式,而Arm 的主要任务之一便是尽可能平稳地实现这一过渡,以充分利用此类关键平台的优势。
顺畅的软件开发体验
建立强大的软件生态系统关键在于为广大开发者打造顺畅的开发体验,以实现对其软件的多架构支持。这涉及到要让开发者能够轻松访问平台,以编写代码、测试功能并执行所需的优化。Works on Arm就是其中一项计划,Arm携手AWS、Equinix和Oracle等云服务伙伴,为开源软件开发者提供免费且可轻松访问各种平台的机会。
在边缘和5G部署方面,我们与Magma和O-RAN联盟等基金会合作推动软件的广泛采用。目前已有一系列良好的生态系统活动来推动软件开发,这将为新兴经济体通过这些计划来实现开放、灵活且经济实惠的运营商级网络奠定良好基础。同样,为了加快5G软件开发工作,我们推出了Arm 5G解决方案实验室,旨在促进软件开发者、OEM厂商、运营商和半导体设计人员之间的紧密合作。
在高度碎片化的物联网和边缘环境中推动标准化的实现,对于开发者的一致体验也至关重要。为此,我们已战略性地投资于Project Cassini和Project Centauri等项目,这些项目可简化将云原生软件体验带到包括远程服务器、5G基站和物联网网关等在内的远边缘设备以及其他基于Arm技术的近边缘端点的流程。为了让软硬件进行无缝集成,让各种操作系统、应用软件能在基于Arm架构的边缘设备实现无缝“开箱即用”,我们推出了SystemReady以覆盖更广泛的市场和操作系统。除红帽、VMWare和Windows外,现利用Arm SystemReady的其他商用操作系统还包括Debian、Fedora、OpenSuse和Yocto Linux。
独立软件开发商合作
在包括云计算的基础设施领域中,对于在传统架构上开发软件的独立软件开发商 (ISV) 而言,将其软件迁移到基于Arm Neoverse的平台有助于为其最终客户提供更具吸引力的性价比和节能优势。
Arm生态系统为此也已制定了推动ISV采用的相关计划,例如AWS Graviton Ready,该计划可为客户提供经由AWS进行技术验证并可与AWS服务集成的解决方案。而对于在Ampere系统上进行部署的客户,经验证的Ampere解决方案能够提供软件支持列表。此外,我们的软件合作伙伴正利用基于Arm Neoverse的平台来支持各种应用场景,例如:
卓越的性能表现
以平台的概念持续大规模的投入下,Arm基础设施生态系统具备灵活和产业化的特点,吸引了腾讯、阿里云等国内互联网头部企业,在基于Arm架构的软件上不断优化项目。通过提供在基于Arm架构的云实例上运行的软件工作负载,头部互联网公司和云服务提供商能获得显著的性能提升、成本节约和性价比优化。
下图阐释了基于Arm Neoverse的AWS Graviton2处理器、Oracle云基础设施 (OCI) Ampere Altra A1计算实例、腾讯云Arm产品、阿里云Arm实例处理的各类工作负载的优异表现:

开源项目激发创新潜能
支持开源软件社区及其驱动的创新对于Arm生态系统的持续发展至关重要。Arm在多个Linux相关的基金会长期扮演技术推进的积极角色,并且在2010年携手生态伙伴一起发起Linaro开源组织。随着软件开发者加速在云原生软件的开发,目前基于Arm硬件的持续集成/持续交付 (CI/CD) 的构建时数每月超过100万分钟,Docker Hub上为Arm架构编写的容器镜像数量超过10万个。
通过Arm的专业技术与在开源社区长期累积的经验,我们也积极开展与国内开源社区的互动与交流,贡献于中国开源社区。TARS微服务开发框架已成功移植至Arm CPU架构;Arm作为龙蜥社区的理事单位,与其共同推动基于Arm架构的软硬一体协同演进、相关功能实现和性能优化,并协助龙蜥社区在社区治理模式、开发管理流程、版本发布等领域进行持续改进。
Arm正携手生态系统合作伙伴,推动变革新一代基础设施设计可为客户提供价值的方式。我们致力于为面向未来的软件开发者打造顺畅的开发体验,从而推动创新并加速产业革新。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。