多项合作成果为基于Arm的解决方案带来更多可能性。这些合作包括:NVIDIA GPU与基于AWS Graviton2的Amazon EC2实例相结合,以及包含Ampere Computing 的CPU和双GPU的HPC开发者套件等
加利福尼亚州圣克拉拉市——GTC大会——太平洋时间2021年4月12日——NVIDIA于今日宣布通过一系列合作,将NVIDIA的GPU和软件与基于Arm®的CPU相结合,使得Arm架构灵活和高能效的优点扩展至从云到边缘的各类计算工作负载。
这些合作包括:将基于AWS Graviton2的Amazon EC2实例与NVIDIA GPU相结合;通过全新HPC开发者套件,为科学和AI应用的开发提供支持;提升边缘视频分析和安全功能;打造新一类基于Arm并搭载NVIDIA RTX™ GPU的新款PC。
NVIDIA创始人兼首席执行官黄仁勋表示:“Arm的高能效和IP商业模式使其成为了全球最受欢迎的CPU。Arm生态系统中包括全球各地的技术公司,他们蓄势待发,致力于将基于Arm的产品带入云、超级计算、PC和自主系统等新市场。我们致力于将Arm生态系统扩展到移动和嵌入式系统以外的市场,而今日宣布的新合作伙伴关系,正是我们迈出的重要一步。”
NVIDIA GPU 与基于AWS Graviton2的Amazon EC2实例相结合
NVIDIA和AWS于今日宣布,双方将一同在云端部署由GPU加速的基于Arm的实例。新的Amazon EC2实例将AWS Graviton2处理器和NVIDIA GPU相结合,将实现多重优势,包括降低成本,支持更丰富的游戏串流体验,以及为基于Arm的工作负载提供更高的性能。
通过这些实例,游戏开发者将能够在AWS上本地运行安卓游戏,使用NVIDIA GPU加速渲染和编码,且无需运行仿真软件就能将游戏串流传输至移动设备。
HPC开发者套件
随着市场对高能效超级计算机和数据中心的需求不断增长,NVIDIA发布了NVIDIA Arm HPC开发者套件,为科学计算提供支持。该套件包含1个Ampere® Altra® CPU,它拥有80个运行频率高达3.3GHz 的Arm Neoverse核;双NVIDIA A100 GPU,每个GPU可提供312 teraflops 的FP16深度学习性能;以及两个用于加速网络、存储和安全的NVIDIA BlueField-2® DPU。
该开发者套件可运行NVIDIA HPC SDK,这是一套编译器、库和工具,将助力工程师、科学家和开发者创建HPC和AI应用,并将其迁移到GPU加速的Arm计算系统中。
开发者和ISV合作伙伴可使用开发者套件,轻松地对其软件进行迁移和确认,并进行性能分析。率先展开部署的顶尖计算中心包括:美国的橡树岭国家实验室(Oak Ridge National Laboratory)、洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)和石溪大学(Stony Brook University);台湾地区的高速网路与计算中心(National Center for High Performance Computing);以及韩国科学技术研究院 (Korean Institute of Science and Technology)。
Ampere Computing高级解决方案总监Sean Varley表示:“NVIDIA GPU和DPU加速器与云原生Ampere® Altra®处理器的强大组合,能够为我们的客户提供一流的性能、可扩展性、实例、以及核密度,同时还能极富预见性地执行要求严苛的数据中心和云工作负载,如云游戏、HPC、科学计算、AI和网络等。NVIDIA的Arm HPC开发者套件提供了一个便利的途径来测试这种世界一流的组合,以应对最具挑战性的工作负载。”
开发者可点击此处申请抢先试用。该开发者套件将于2021年第三季度上市。
此外,NVIDIA正在与实验室负责人、科学家和合作伙伴展开合作,帮助他们将软件移植到Arm CPU和NVIDIA GPU上运行。
边缘和PC领域的合作
NVIDIA正在扩大与Marvell的合作,将OCTEON® DPU与GPU相结合,以加速云、企业、运营商和边缘应用。两者的结合将加速AI工作负载,例如从边缘到云端的网络优化和安全,以提升系统性能并降低延迟。
Marvell总裁兼首席执行官Matt Murphy表示:“Marvell基于Arm的OCTEON DPU平台致力于提供行业领先的解决方案,以满足云数据中心对安全性、网络和存储方面不断提升的要求,这一点一直以来也得到了业界的认可。 我们很高兴能够进一步扩展与NVIDIA多年的合作关系,将OCTEON DPU与NVIDIA GPU相结合,为视频分析和网络安全解决方案提供加速,以满足新兴的边缘到云应用的需求。”
在PC领域,NVIDIA与全球最大的基于Arm的SoC供应商之一联发科合作,致力于共同打造一个支持Chromium、Linux和NVIDIA SDK的参考平台。NVIDIA RTX GPU与高性能、高能效的Arm Cortex®处理器相结合,将为新款笔记本电脑带来逼真的光线追踪图形技术和顶尖的AI技术。
联发科首席执行官Rick Tsai表示:“联发科是全球最大的Arm芯片供应商,我们的芯片用于包括智能手机、Chromebook和智能电视在内的所有产品中。我们期待发挥自身的技术专长,与NVIDIA合作,将GPU的性能带入Arm PC平台,使其能够应用于游戏、内容创作等更多领域。GPU加速将极大地推动整个Arm生态系统的发展。”
欲了解更多信息,可免费注册4月12日-16日在线举办的GTC21。GTC21主题演讲中文字幕版将于北京时间4月13日上午9:00播出,敬请关注。
更多合作伙伴的支持
NVIDIA正在与富士通和SiPearl等其他合作伙伴共同致力于扩展Arm生态系统。
富士通有限公司企业执行官、高级副总裁兼未来社会与技术部副部长Naoki Shinjo 表示:“我们与NVIDIA和Arm生态系统的合作将加快HPC和数据科学的发展,为研究人员提供更广阔的发展机会,以打造创新的解决方案助力科研领域的突破。”
SiPearl首席执行官Philippe Notton表示:“SiPearl正在设计并向市场推出欧洲的高性能、高能效处理器Rhea,它将为欧洲的exascale(百亿亿次级)超级计算机提供支持。NVIDIA的新工具和SDK将帮助开发者为Arm构建加速HPC应用,为超级计算中心提供丰富的Arm生态系统。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。