Arm 基础设施事业部高级产品经理 Mohit Taneja
Arm 基础设施事业部产品总监 Saptarshi Mondal
实现高性能定制芯片
Arm Neoverse 旨在为从云到边缘的全场景基础设施用例提供高性能和出色能效。针对需要更高性能的工作负载和用例,Arm 推出了 Neoverse V 系列。其中,Neoverse V2 核心已被行业先行者广泛部署于云、高性能计算 (HPC) 和人工智能 (AI) 领域。亚马逊云科技 (AWS) 在 re:Invent 2023 上宣布推出 AWS Graviton4 CPU。与前代 Graviton CPU 相比,Graviton4 可提供更多核心数、更大内存配置。NVIDIA 的 Grace CPU 超级芯片和 Grace Hopper 超级芯片则力求为 HPC 和 AI/ML 工作负载带来更出色的性能和能效。近期,Arm 宣布推出了新一代 Neoverse V 系列产品,即 Neoverse V3 CPU 和 Neoverse CSS V3。
Arm Neoverse 计算子系统 (CSS) 产品旨在帮助 Arm 合作伙伴以风险更低的方式,更迅速地将新 Neoverse 技术推向市场,更好地帮助客户实现差异化。基于由 Arm 工程团队配置、验证和优化的 CSS,Arm 合作伙伴可以在更高起点上推进自研定制芯片的进程,并让他们更能充分发挥内部工程技术人才的潜力,针对其工作负载和操作环境进行优化,实现更出色的性能和总拥有成本 (TCO)。此前 Microsoft 推出的 Azure Cobalt 100 CPU 正是客户与 Arm 合作将专用芯片推向市场的一大例证。
Neoverse CSS V3 延续了 Neoverse CSS 在加快上市进程和定制化方面的优势。Neoverse CSS V3 兼具卓越的性能、效率和差异化等特性,能为我们的合作伙伴提供从概念到部署新一代云计算的便捷路径。与 CSS N2 相比,CSS V3 的单芯片性能提高了 50% ,可以更有效地帮助我们的合作伙伴应对一系列新工作负载以及用例。
以下让我们来深入了解 Neoverse V3 和 CSS V3,并进一步探究它们将如何为云基础设施创造价值。
Neoverse CSS V3 概述
图 1:Neoverse CSS V3 概览
基于 Neoverse V3 CPU 打造的 Neoverse CSS V3 是一个可定制的计算子系统,由 Arm 进行系统配置、系统验证、系统认证和 PPA 优化。与传统的开发方法相比,通过 CSS,Arm 可帮助合作伙伴执行通用无差别的繁重任务,使其能够以更低的风险和成本,以及更快的时间构建专用芯片。
结合系统级创新技术,Neoverse V3 CPU 能使 CSS V3 为 SPECint2017(预估)提供比 CSS N2 高出 50% 的单芯片性能。此外,CSS V3 还为机器学习 (ML)、数据库和加密等一系列的基础设施工作负载带来了同样令人惊艳的单芯片性能提升。
Neoverse CSS V3 具备新一代基础设施平台所需的特性和功能,能为我们的合作伙伴提供生产芯片的快速途径,同时还可为其管控风险并实现超快部署。
此外,Neoverse CSS V3 还为市场带来了许多新的系统级功能:
CSS V3 构成了专用计算系统的关键构建模块,可以降低通用计算子系统的设计和验证成本,让我们的合作伙伴将更多的精力集中在其专业领域上,加速产品上市,同时降低风险并加快部署进度。CSS V3 提供多种配置,其中单芯片最多可配置 128 个 Neoverse V3 核心,并支持双芯片配置。此外还可以支持更少核数的配置(例如 32 核)。CSS V3 主要针对三纳米级工艺节点,并附带支持性的布局图和实施流程,以更大限度降低物理设计风险。
Neoverse V3 CPU 概述
Neoverse V3 CPU 在 Neoverse V2 基础上进行了大幅的架构改进。
图 2:Neoverse V3 CPU
强化的平台:云基础设施的安全性和可靠性不容小觑
这些技术创新成就了 Neoverse V3 成为一个符合我们合作伙伴及其客户需求的强化平台。
针对 TCO 进行优化的计算:云原生工作负载需要针对 TCO 进行优化定制
在标准配置和特定配置中,Neoverse V3 CPU 固有的灵活性都能显著改进实际工作负载的性能。这些出色的服务器 CPU 不仅可以适配苛刻的 AI 和 HPC 应用,还适合部署到更传统的企业级基础设施软件中。举例来说,与 Neoverse V2 相比,Neoverse V3 的 AI 数据分析性能提高了 84%,RDBMS 性能提高了 16%,加密性能提高了 9%,而整数型工作负载性能则提高了 12%。
图 3:针对云计算工作负载,Neoverse V3 相比于 Neoverse V2 的性能提升情况 (%)
总结
Neoverse V3 和 CSS V3 旨在满足愈发严苛的超大规模云基础设施需求,可以为新一代 AI、HPC 和云原生工作负载提供 TCO 更优、性能更强的基础设施构建模块,并加快产品上市步伐。Arm 正在进行大量投资,大力帮助合作伙伴将基于 Neoverse V3 平台的产品以更优惠的价格、更快的速度推向市场,助其从一开始就做好万全准备。欢迎与我们携手,共同基于 Arm 平台构建未来。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。