覆盖云、HPC、边缘和PC NVIDIA与Arm的协同效应显现原创

作者：李祥敬

我们看到NVIDIA除了GPU之外，CPU与DPU都与Arm有着巨大的关系，这样未来NVIDIA未来将会同时具备GPU、CPU和DPU三种芯片，这意味后续NVIDIA的发展提供了巨大巨大的想象空间。

去年，英伟达（NVIDIA）公司宣布，日本软银集团和英伟达已达成一项协议，后者将以400亿美元的价格从软银集团手中收购英国芯片设计公司Arm。当时的官方新闻稿说，此次合并将NVIDIA领先的AI计算平台与Arm广阔的生态系统结合在一起，创建一个人工智能时代的顶级计算公司，在加速创新的同时把公司带到大型，高增长的市场。

应该说这样的愿景非常宏大，而在近日举行的GTC 2021大会上，NVIDIA宣布了多个基于Arm的解决方案，为双方的协同创新做了最好的注脚。这些解决方案将NVIDIA的GPU和软件与基于Arm的CPU相结合，使得Arm架构灵活和高能效的优点扩展至从云到边缘的各类计算工作负载。

这些解决方案覆盖了从云端到软件、HPC、边缘计算和终端，包括将基于AWS Graviton2的Amazon EC2实例与NVIDIA GPU相结合；通过全新HPC开发者套件，为科学和AI应用的开发提供支持；提升边缘视频分析和安全功能；打造新一类基于Arm并搭载NVIDIA RTX GPU的新款PC。

NVIDIA创始人兼首席执行官黄仁勋表示：“Arm的高能效和IP商业模式使其成为了全球最受欢迎的CPU。Arm生态系统中包括全球各地的技术公司，他们蓄势待发，致力于将基于Arm的产品带入云、超级计算、PC和自主系统等新市场。我们致力于将Arm生态系统扩展到移动和嵌入式系统以外的市场，而今日宣布的新合作伙伴关系，正是我们迈出的重要一步。”

云端合作瞄准新机会

NVIDIA与CSP的合作其实非常广泛，当然这也包括AWS。只不过这次NVIDIA和AWS是在云端部署由GPU加速的基于Arm的实例。新的Amazon EC2实例将AWS Graviton2处理器和NVIDIA GPU相结合，将实现多重优势，包括降低成本，支持更丰富的游戏串流体验，以及为基于Arm的工作负载提供更高的性能。通过这些实例，游戏开发者将能够在AWS上本地运行安卓游戏，使用NVIDIA GPU加速渲染和编码，且无需运行仿真软件就能将游戏串流传输至移动设备。

其实除了AWS，在云计算领域，NVIDIA与Arm服务器SoC和OEM合作伙伴也开展了多个方面的合作。例如，NVIDIA与Ampere Computing合作，基于Ampere Altra的系统包含两个80核Arm SoC、四个NVIDIA T4 GPU和一个NVIDIA Mellanox BlueField-2 DPU。它们可以同时为128名游戏用户提供服务，为Android-in-Cloud服务提供流媒体服务，这种服务受到中国越来越多的5G智能手机用户的欢迎。

此外，NVIDIA工程师不断在向Arm移植代码，并开发新的工具来优化Arm服务器和用户之间的云游戏编码、渲染和串流传输方式。这些工具被技嘉科技、浪潮和纬颖等Arm服务器OEM合作伙伴所广泛使用。

除游戏外，云服务供应商还支持用于GPU加速的机器学习、存储和其他应用的Arm服务器。因此，NVIDIA为Arm服务器提供一系列GPU管理和监控工具，包括可以在内置Kubernetes的Arm上运行Docker容器的NVIDIA容器工具集。

高性能计算的新方向

去年由日本理研所和富士通联合开发的基于Arm架构的超级计算机 “富岳（Fugaku）”连续第二次登上Top500榜首。“富岳”（Fugaku）是世界上第一台Arm架构处理器驱动的TOP500高性能计算集群，认证算力超过51.3亿亿次每秒。

这足以看出Arm在HPC领域的巨大潜力，而在近日Armv9的推出更是Arm处理器将不再局限于移动/嵌入式市场，现已经扩展到PC、HPC高性能计算、深度学习等新市场。例如Armv9支持SVE2指令集，SVE最早是ARM与富士通合作的浮点性能扩展，TOP500超算富岳就使用SVE指令集，SVE2就是第二代SVE浮点指令。

与SVE的128位矢量相比，SVE2可以支持128为倍数、最多2048位运算。因此SVE2可以增强ML机器学习、DSP信号处理能力，提升未来5G、虚拟现实、增强现实以及CPU本地运行ML的性能，同时Arm未来还会继续提升AI人工智能性能。

在本次GTC大会上，NVIDIA发布了NVIDIA Arm HPC开发者套件，为科学计算提供支持。该套件包含1个Ampere Altra CPU，它拥有80个运行频率高达3.3GHz 的Arm Neoverse核；双NVIDIA A100 GPU，每个GPU可提供312 teraflops 的FP16深度学习性能；以及两个用于加速网络、存储和安全的NVIDIA BlueField-2 DPU。

该开发者套件可运行NVIDIA HPC SDK，这是一套编译器、库和工具，将助力工程师、科学家和开发者创建HPC和AI应用，并将其迁移到GPU加速的Arm计算系统中。开发者和ISV合作伙伴可使用开发者套件，轻松地对其软件进行迁移和确认，并进行性能分析。

该开发者套件将于2021年第三季度上市。此外，NVIDIA正在与实验室负责人、科学家和合作伙伴展开合作，帮助他们将软件移植到Arm CPU和NVIDIA GPU上运行。

在HPC和数据科学方面，NVIDIA正在与富士通和SiPearl等其他合作伙伴共同致力于扩展Arm生态系统。其中，SiPearl正在设计并向市场推出欧洲的高性能、高能效处理器Rhea，它将为欧洲的exascale（百亿亿次级）超级计算机提供支持。NVIDIA的新工具和SDK将帮助开发者为Arm构建加速HPC应用，为超级计算中心提供丰富的Arm生态系统。

总之，得到NVIDIA大量工具支持的Arm处理器IP产品组合等先进技术让各种新的平台成为可能。用于Arm的CUDA工具包将NVIDIA GPU加速计算和AI功能引入Arm生态系统。通过CUDA，开发者可以访问TensorRT进行深度学习推理、访问DeepStream进行视频分析等。

边缘计算与终端

除了云端数据中心和HPC等领域，NVIDIA正在扩大与Marvell的合作，将OCTEON DPU与GPU相结合，以加速云、企业、运营商和边缘应用。两者的结合将加速AI工作负载，例如从边缘到云端的网络优化和安全，以提升系统性能并降低延迟。

企业网络的边缘是下一个重要的计算领域。NVIDIA EGX边缘AI平台将支持包括Arm在内的所有主要处理器架构。由于认识到边缘对高能效计算的需求，NVIDIA将Arm作为其各垂直市场加速计算和AI平台的核心。通常，这些平台将GPU与像Jetson等嵌入式模块中的多核Arm CPU配对。NVIDIA将这些模块的定制版本与专用于医疗（Clara）、机器人（Isaac）、自动驾驶汽车（DRIVE）等行业的开发者套件配对，为Arm软件合作伙伴和SoC供应商提供了大量实现企业AI的机会。

在PC领域，目前多家供应商的Windows PC和Chromebook已在Arm处理器上运行，并且更多消费级平台正在加入其中，此举推动了未来个人系统的发展。NVIDIA长期以来使用GPU支持各种形状和尺寸的PC，包括基于Arm的系统。最近的一项调查显示，超过70％的游戏PC使用NVIDIA GPU。

在GTC大会上，NVIDIA与全球最大的基于Arm的SoC供应商之一联发科合作，致力于共同打造一个支持Chromium、Linux和NVIDIA SDK的参考平台。NVIDIA RTX GPU与高性能、高能效的Arm Cortex处理器相结合，将为新款笔记本电脑带来逼真的光线追踪图形技术和顶尖的AI技术。

未来，具有丰富图形和连接性、性能与当今PC一样强大且更加节能的AI加速的个人系统将迎来机遇。Arm生态系统可以在个人系统等各个市场中使用NVIDIA 参考设计，就像当前在医疗市场中使用的那样。

总结

NVIDIA与Arm的协同效应正在持续发酵。在记者写作本文的同时，我获悉NVIDIA也推出了自己的首款数据中心CPU——Grace，而这款服务器就是基于Arm数据中心架构。我们看到NVIDIA除了GPU之外，CPU与DPU都与Arm有着巨大的关系，这样未来NVIDIA未来将会同时具备GPU、CPU和DPU三种芯片，这意味后续NVIDIA的发展提供了巨大巨大的想象空间。

来源：至顶网计算频道

ARM
NVIDIA

0赞

好文章，需要你的鼓励

覆盖云、HPC、边缘和PC NVIDIA与Arm的协同效应显现 原创

来源：至顶网计算频道

2021

04/13

11:32

分享

点赞

后Transformer模型系统能够推动变革

德国实验室推出DeepSeek R1-0528变体，速度提升200%

Sakana AI 推出 TreeQuest：多模型团队表现超越单一大语言模型30%

蚂蚁国际联合国际掉期与衍生工具协会ISDA在新加坡发布跨境支付通证化行业框架

AI时代的“摆渡人”：从云起到智深，源信网络的七年穿越

OpenAI投资人Vinod Khosla：AI如何五年掌握80%工作技能？

微软启动新一轮裁员计划，9000名员工受影响

Wonder Dynamics联合创始人加入2025年TechCrunch Disrupt AI舞台

全球风投二季度复苏迹象显现，AI交易主导资本流向

什么是Perplexity？这款AI聊天机器人全方位解读

英超联赛推出AI工具提升球迷体验

Lovable计划融资1.5亿美元，估值达20亿美元

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

NVIDIA 初创加速计划 | 2024 NVIDIA 创业企业展示完美收官!

老黄掏出“迷你版AI超算”，每秒67万亿次运算，仅售2070元人民币

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

覆盖云、HPC、边缘和PC NVIDIA与Arm的协同效应显现原创