Arm 基础设施事业部高级产品经理 Mohit Taneja
Arm 基础设施事业部产品总监 Saptarshi Mondal
实现高性能定制芯片
Arm Neoverse 旨在为从云到边缘的全场景基础设施用例提供高性能和出色能效。针对需要更高性能的工作负载和用例,Arm 推出了 Neoverse V 系列。其中,Neoverse V2 核心已被行业先行者广泛部署于云、高性能计算 (HPC) 和人工智能 (AI) 领域。亚马逊云科技 (AWS) 在 re:Invent 2023 上宣布推出 AWS Graviton4 CPU。与前代 Graviton CPU 相比,Graviton4 可提供更多核心数、更大内存配置。NVIDIA 的 Grace CPU 超级芯片和 Grace Hopper 超级芯片则力求为 HPC 和 AI/ML 工作负载带来更出色的性能和能效。近期,Arm 宣布推出了新一代 Neoverse V 系列产品,即 Neoverse V3 CPU 和 Neoverse CSS V3。
Arm Neoverse 计算子系统 (CSS) 产品旨在帮助 Arm 合作伙伴以风险更低的方式,更迅速地将新 Neoverse 技术推向市场,更好地帮助客户实现差异化。基于由 Arm 工程团队配置、验证和优化的 CSS,Arm 合作伙伴可以在更高起点上推进自研定制芯片的进程,并让他们更能充分发挥内部工程技术人才的潜力,针对其工作负载和操作环境进行优化,实现更出色的性能和总拥有成本 (TCO)。此前 Microsoft 推出的 Azure Cobalt 100 CPU 正是客户与 Arm 合作将专用芯片推向市场的一大例证。
Neoverse CSS V3 延续了 Neoverse CSS 在加快上市进程和定制化方面的优势。Neoverse CSS V3 兼具卓越的性能、效率和差异化等特性,能为我们的合作伙伴提供从概念到部署新一代云计算的便捷路径。与 CSS N2 相比,CSS V3 的单芯片性能提高了 50% ,可以更有效地帮助我们的合作伙伴应对一系列新工作负载以及用例。
以下让我们来深入了解 Neoverse V3 和 CSS V3,并进一步探究它们将如何为云基础设施创造价值。
Neoverse CSS V3 概述
图 1:Neoverse CSS V3 概览
基于 Neoverse V3 CPU 打造的 Neoverse CSS V3 是一个可定制的计算子系统,由 Arm 进行系统配置、系统验证、系统认证和 PPA 优化。与传统的开发方法相比,通过 CSS,Arm 可帮助合作伙伴执行通用无差别的繁重任务,使其能够以更低的风险和成本,以及更快的时间构建专用芯片。
结合系统级创新技术,Neoverse V3 CPU 能使 CSS V3 为 SPECint2017(预估)提供比 CSS N2 高出 50% 的单芯片性能。此外,CSS V3 还为机器学习 (ML)、数据库和加密等一系列的基础设施工作负载带来了同样令人惊艳的单芯片性能提升。
Neoverse CSS V3 具备新一代基础设施平台所需的特性和功能,能为我们的合作伙伴提供生产芯片的快速途径,同时还可为其管控风险并实现超快部署。
此外,Neoverse CSS V3 还为市场带来了许多新的系统级功能:
CSS V3 构成了专用计算系统的关键构建模块,可以降低通用计算子系统的设计和验证成本,让我们的合作伙伴将更多的精力集中在其专业领域上,加速产品上市,同时降低风险并加快部署进度。CSS V3 提供多种配置,其中单芯片最多可配置 128 个 Neoverse V3 核心,并支持双芯片配置。此外还可以支持更少核数的配置(例如 32 核)。CSS V3 主要针对三纳米级工艺节点,并附带支持性的布局图和实施流程,以更大限度降低物理设计风险。
Neoverse V3 CPU 概述
Neoverse V3 CPU 在 Neoverse V2 基础上进行了大幅的架构改进。
图 2:Neoverse V3 CPU
强化的平台:云基础设施的安全性和可靠性不容小觑
这些技术创新成就了 Neoverse V3 成为一个符合我们合作伙伴及其客户需求的强化平台。
针对 TCO 进行优化的计算:云原生工作负载需要针对 TCO 进行优化定制
在标准配置和特定配置中,Neoverse V3 CPU 固有的灵活性都能显著改进实际工作负载的性能。这些出色的服务器 CPU 不仅可以适配苛刻的 AI 和 HPC 应用,还适合部署到更传统的企业级基础设施软件中。举例来说,与 Neoverse V2 相比,Neoverse V3 的 AI 数据分析性能提高了 84%,RDBMS 性能提高了 16%,加密性能提高了 9%,而整数型工作负载性能则提高了 12%。
图 3:针对云计算工作负载,Neoverse V3 相比于 Neoverse V2 的性能提升情况 (%)
总结
Neoverse V3 和 CSS V3 旨在满足愈发严苛的超大规模云基础设施需求,可以为新一代 AI、HPC 和云原生工作负载提供 TCO 更优、性能更强的基础设施构建模块,并加快产品上市步伐。Arm 正在进行大量投资,大力帮助合作伙伴将基于 Neoverse V3 平台的产品以更优惠的价格、更快的速度推向市场,助其从一开始就做好万全准备。欢迎与我们携手,共同基于 Arm 平台构建未来。
好文章,需要你的鼓励
本文探讨如何使用生成式AI和大语言模型作为倾听者,帮助用户表达内心想法。许多主流AI如ChatGPT、Claude等被设计成用户的"最佳伙伴",或试图提供心理健康建议,但有时用户只想要一个尊重的倾听者。文章提供了有效的提示词技巧,指导AI保持中性、尊重的态度,专注于倾听和理解,而非给出建议或判断。同时提醒用户注意隐私保护和AI的局限性。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
人工通用智能和超级人工智能的出现,可能会创造出一种全新的外星智能形态。传统AI基于人类智能模式构建,但AGI和ASI一旦存在,可能会选择创造完全不同于人类认知方式的新型智能。这种外星人工智能既可能带来突破性进展,如找到癌症治愈方法,也可能存在未知风险。目前尚不确定这种新智能形态是否会超越人类智能,以及我们是否应该追求这一可能改变人类命运的技术突破。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。