Arm 基础设施事业部高级产品经理 Mohit Taneja
Arm 基础设施事业部产品总监 Saptarshi Mondal
实现高性能定制芯片
Arm Neoverse 旨在为从云到边缘的全场景基础设施用例提供高性能和出色能效。针对需要更高性能的工作负载和用例,Arm 推出了 Neoverse V 系列。其中,Neoverse V2 核心已被行业先行者广泛部署于云、高性能计算 (HPC) 和人工智能 (AI) 领域。亚马逊云科技 (AWS) 在 re:Invent 2023 上宣布推出 AWS Graviton4 CPU。与前代 Graviton CPU 相比,Graviton4 可提供更多核心数、更大内存配置。NVIDIA 的 Grace CPU 超级芯片和 Grace Hopper 超级芯片则力求为 HPC 和 AI/ML 工作负载带来更出色的性能和能效。近期,Arm 宣布推出了新一代 Neoverse V 系列产品,即 Neoverse V3 CPU 和 Neoverse CSS V3。
Arm Neoverse 计算子系统 (CSS) 产品旨在帮助 Arm 合作伙伴以风险更低的方式,更迅速地将新 Neoverse 技术推向市场,更好地帮助客户实现差异化。基于由 Arm 工程团队配置、验证和优化的 CSS,Arm 合作伙伴可以在更高起点上推进自研定制芯片的进程,并让他们更能充分发挥内部工程技术人才的潜力,针对其工作负载和操作环境进行优化,实现更出色的性能和总拥有成本 (TCO)。此前 Microsoft 推出的 Azure Cobalt 100 CPU 正是客户与 Arm 合作将专用芯片推向市场的一大例证。
Neoverse CSS V3 延续了 Neoverse CSS 在加快上市进程和定制化方面的优势。Neoverse CSS V3 兼具卓越的性能、效率和差异化等特性,能为我们的合作伙伴提供从概念到部署新一代云计算的便捷路径。与 CSS N2 相比,CSS V3 的单芯片性能提高了 50% ,可以更有效地帮助我们的合作伙伴应对一系列新工作负载以及用例。
以下让我们来深入了解 Neoverse V3 和 CSS V3,并进一步探究它们将如何为云基础设施创造价值。
Neoverse CSS V3 概述
图 1:Neoverse CSS V3 概览
基于 Neoverse V3 CPU 打造的 Neoverse CSS V3 是一个可定制的计算子系统,由 Arm 进行系统配置、系统验证、系统认证和 PPA 优化。与传统的开发方法相比,通过 CSS,Arm 可帮助合作伙伴执行通用无差别的繁重任务,使其能够以更低的风险和成本,以及更快的时间构建专用芯片。
结合系统级创新技术,Neoverse V3 CPU 能使 CSS V3 为 SPECint2017(预估)提供比 CSS N2 高出 50% 的单芯片性能。此外,CSS V3 还为机器学习 (ML)、数据库和加密等一系列的基础设施工作负载带来了同样令人惊艳的单芯片性能提升。
Neoverse CSS V3 具备新一代基础设施平台所需的特性和功能,能为我们的合作伙伴提供生产芯片的快速途径,同时还可为其管控风险并实现超快部署。
此外,Neoverse CSS V3 还为市场带来了许多新的系统级功能:
CSS V3 构成了专用计算系统的关键构建模块,可以降低通用计算子系统的设计和验证成本,让我们的合作伙伴将更多的精力集中在其专业领域上,加速产品上市,同时降低风险并加快部署进度。CSS V3 提供多种配置,其中单芯片最多可配置 128 个 Neoverse V3 核心,并支持双芯片配置。此外还可以支持更少核数的配置(例如 32 核)。CSS V3 主要针对三纳米级工艺节点,并附带支持性的布局图和实施流程,以更大限度降低物理设计风险。
Neoverse V3 CPU 概述
Neoverse V3 CPU 在 Neoverse V2 基础上进行了大幅的架构改进。
图 2:Neoverse V3 CPU
强化的平台:云基础设施的安全性和可靠性不容小觑
这些技术创新成就了 Neoverse V3 成为一个符合我们合作伙伴及其客户需求的强化平台。
针对 TCO 进行优化的计算:云原生工作负载需要针对 TCO 进行优化定制
在标准配置和特定配置中,Neoverse V3 CPU 固有的灵活性都能显著改进实际工作负载的性能。这些出色的服务器 CPU 不仅可以适配苛刻的 AI 和 HPC 应用,还适合部署到更传统的企业级基础设施软件中。举例来说,与 Neoverse V2 相比,Neoverse V3 的 AI 数据分析性能提高了 84%,RDBMS 性能提高了 16%,加密性能提高了 9%,而整数型工作负载性能则提高了 12%。
图 3:针对云计算工作负载,Neoverse V3 相比于 Neoverse V2 的性能提升情况 (%)
总结
Neoverse V3 和 CSS V3 旨在满足愈发严苛的超大规模云基础设施需求,可以为新一代 AI、HPC 和云原生工作负载提供 TCO 更优、性能更强的基础设施构建模块,并加快产品上市步伐。Arm 正在进行大量投资,大力帮助合作伙伴将基于 Neoverse V3 平台的产品以更优惠的价格、更快的速度推向市场,助其从一开始就做好万全准备。欢迎与我们携手,共同基于 Arm 平台构建未来。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。