至顶网计算频道 03月06日 新闻消息:
— 与HPE的合作致力于在2023年初带来领先的HPC和AI处理性能
— El Capitan将成为美国第二套全部使用AMD CPU和GPU的E级超算(Exascale)系统,且其预期性能将超过现在200台最快的超级计算机的总和
2020年3月6日,加利福尼亚州圣克拉拉讯——AMD(NASDAQ:AMD)公司联合劳伦斯利弗莫尔国家实验室(LLNL)和HPE近日宣布,即将在LLNL实验室面世的E级超算(Exascale百亿亿次)超级计算机El Capitan将采用下一代AMD EPYC CPU和AMD Radeon Instinct GPU,以及开源的AMD ROCm异构计算软件。
El Capitan系统计划在2023年初交付,拥有超过2 exaflops(百亿亿次)的双精度性能,预计交付后将成为世界上最快的超级计算机。这项创纪录的性能将用于支持美国国家核安全局(National Nuclear Security Administration)的重要使命,确保美国核储备的安全、保障及可靠性。
基于AMD的节点也将被优化,来加速人工智能(AI)和机器学习(ML)的工作负载,从而使AI和ML扩展应用到有益于NNSA任务的研究、计算技术和分析中。
AMD高级副总裁兼数据中心与嵌入式解决方案事业部总经理Forrest Norrod表示:“El Capitan超级计算机将借助下一代AMD EPYC CPU和Radeon Instinct GPU推动HPC和AI的空前发展。基于AMD在HPC领域的强大基础,加之以变革性的相关能力,AMD助力NNSA三大实验室(LLNL和Los Alamos以及Sandia国家实验室)能够实现其关键的任务目标,并为行业贡献其在AI领域所取得的创新成就。我们对与HPE和NNSA在E级超算方面的持续合作倍感自豪,期待能够在2023年初交付世界上预期性能最强的超级计算机。”
AMD技术为El Capitan赋能
AMD正在运用其在HPC领域的经验,并为El Capitan改进其现有的CPU和GPU设计,从而使El Capitan系统能够具备超强的性能和易用性。
El Capitan采用的AMD技术包括:
· 具有“ Zen 4”处理器内核,代号为“Genoa”(热那亚)的下一代AMD EPYC处理器。这些处理器支持下一代内存和I/O子系统以用于AI和HPC工作负载。
· 下一代Radeon Instinct GPU,基于为HPC和AI等工作负载而优化计算的新型架构,这些GPU将采用下一代高带宽内存,旨在实现最优的深度学习性能。
· 第三代AMD Infinity架构,将在El Capitan每个节点中包含的四个Radeon Instinct GPU和一个AMD EPYC CPU之间提供高带宽、低延迟的互连。 同时,该架构还包括跨CPU和GPU的统一内存,从而使程序员更容易访问加速计算。
· 正在开发中的开源ROCm异构编程环境的增强版本,以利用AMD CPU和GPU的组合发挥最强性能。
LLNL实验室主任Bill Goldstein表示:“AMD先进的CPU和GPU技术所提供的前所未有的计算能力,将有助于维持美国在高性能计算领域的全球地位。今天的新闻是一个展现政府如何与行业协同合作,最终惠及整个国家的典型范例。”
HPE高级副总裁兼高性能计算和关键任务解决方案总经理Peter Ungaro 表示:“我们很荣幸与AMD携手,将HPE的Cray Shasta架构与最新的AMD EPYC CPU和Radeon Instinct GPU相结合,以此领先的技术为劳伦斯利弗莫尔国家实验室的关键HPC和AI工作负载提供支持。从过去一年我们赢得的三个美国E级超算项目以来,包括美国能源部橡树岭国家实验室的Frontier超级计算机,配备AMD处理器和GPU的HPE系统和技术已成为高性能计算和E级超算的独特解决方案。 我们期待与AMD持续合作,以释放更多的创新潜能。”
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。