2020年11月18日,加利福尼亚州圣克拉拉讯——在今年的SC20虚拟展会上,AMD展示了其在高性能计算(HPC)行业的领导地位,并发布了支持ROCm 4.0开源生态系统的AMD Instinct MI100加速显卡,同时还公布了一份正在不断增长的、支持AMD EPYC处理器以及AMD Instinct MI100加速显卡的合作伙伴名单,并强调了与微软Azure在云计算中针对HPC的合作。在预期2021年第一季度公开发布基于“Zen 3”核心架构的第三代EPYC处理器、OEM同步上市之前,AMD将按计划为部分HPC和云计算客户在本季度开始批量供货。
全新AMD Instinct MI100加速显卡为科研工作负载带来了革命性的HPC性能,同时也是首个跨过10万亿次浮点运算(FP64)性能门槛的加速显卡。基于AMD全新CDNA架构的AMD Instinct MI100,在与第二代AMD EPYC处理器搭配使用时可为系统加速HPC和AI工作负载。有了戴尔、技嘉、HPE和Supermicro这些新加速计算平台的支持,并与AMD EPYC处理器和ROCm 4.0开源软件平台相结合,MI100旨在推动百亿亿次级时代到来之前的科学新发现。
AMD高级副总裁兼数据中心和嵌入式解决方案业务总经理Forrest Norrod表示:“在HPC领域,没有哪个客户的需求是相同的,从内部小型机群到云虚拟机,再到百亿亿次级超级计算机,AMD正在开启一条通往代表着当今行业领先技术和能力的道路,这些技术和能力对支持他们的HPC工作负载至关重要。通过将AMD EPYC处理器和Instinct加速显卡与关键应用软件和开发工具相结合,AMD可为HPC工作负载提供业界领先的性能支持。”
AMD与微软Azure赋能云端HPC
Azure正在使用第二代AMD EPYC处理器为其HBv2虚拟机(VMs)提供HPC工作负载性能。相较第一代HB系列虚拟机,新一代虚拟机可提供高达2倍的性能,支持多达80000核的MPI工作,并很好地利用了第二代AMD EPYC处理器业内领先的超大内存带宽优势。
HBv2虚拟机拥有众多用户,其中包括伊利诺伊大学厄巴纳-香槟分校的贝克曼高级科学技术研究所,该研究所仅用了86,400核就能构建了过去往往需要领先的超级计算机才能建模的植物病毒,美国海军也通过该虚拟机快速部署并按需进行增强的气候和海洋模型预测。基于第二代AMD EPYC处理器的HBv2虚拟机同样也为微软今年早些时候所宣布的OpenAI环境提供了大部分处理器计算能力。
AMD EPYC处理器还帮助HBv2虚拟机跨越了多个新的云HPC里程碑,例如使用NAMD创下了云MPI扩展结果的新纪录,跻身Graph500排行榜前二十名;以及成为了首个1TB/s云HPC并行文件系统。通过这些记录和其它应用基准测试可以看出,HBv2可以提供比任何现有公有云都领先的扩展性。
除了现有的基于第二代AMD EPYC处理器的HBv2 HPC虚拟机外,Azure还宣布它将在未来支持代号为“Milan”的下一代AMD EPYC处理器,并将用在HB系列HPC虚拟机上。
AMD一直是HPC的绝佳选择
AMD EPYC处理器和Instinct加速显卡具备横跨各种平台、支持大量HPC工作负载的性能和能力。无论从研究中心的小型机群,到商用HPC、外部部署和云计算,再到百亿亿次级计算,AMD将持续不断的为HPC解决方案提供性能和选择。
HPE与CSC芬兰公司以及EuroHPC公司最近推出了一个名为LUMI的次百亿亿次级系统。该系统基于HPE Cray EX超级计算机架构,并将使用下一代AMD EPYC处理器和Instinct加速显卡,预计2021年上线时将可提供552petaflops的峰值性能,使其成为世界上首屈一指的超级计算机。
除了LUMI之外,基于AMD的HPC系统的名单还在不断增长。自SC19以来,已经有超过15个超算系统宣布使用AMD EPYC处理器或Instinct加速显卡,或两者兼有。主要包括:
Chicoma–洛斯阿拉莫斯国家实验室–该系统基于HPE Cray EX超级计算机架构,使用了第二代AMD EPYC处理器,并结合300 terabytes的系统内存用于COVID-19的研究工作。
Corona-劳伦斯利弗莫尔国家实验室–该系统最近得到了来自《冠状病毒援助、救济和经济安全法案》的资助并进行了升级,新增了近1000台AMD Instinct MI50加速显卡,使其最高性能超过11petaFLOPs。
Mammoth–劳伦斯利弗莫尔国家实验室– “大内存”集群使用了第二代AMD EPYC处理器进行研究COVID-19的科学家们所急需的基因组学分析和图形分析。
Northern Data–这是一个位于欧洲的分布式计算系统,通过使用AMDEPYC处理器和Instinct加速显卡进行大规模HPC应用,例如渲染、人工智能和深度学习等。
Pawsey超算中心–通过使用HPE Cray EX超级计算机架构以及未来的AMD EPYC处理器和AMD Instinct加速显卡,届时Pawsey超级计算机将成为澳大利亚顶尖的超级计算机。
此外,AMD还在为以下超级计算机提供支持:Anvil和Bell–普渡大学,Big Red 200–印第安纳大学,Bridges 2–匹兹堡超算中心,CERN、欧洲中期气象预报中心、Expanse–圣地亚哥超算中心,法兰克福大学、IT4Innovations国家超算中心、Jetstream 2–印第安纳大学,Mahti– CSC,Manqi–明尼苏达大学,国家海洋和大气管理局、Red Raider–德州理工大学,TinkerCliffs–弗吉尼亚理工大学。
圣地亚哥超算中心主任Michael Normam表示:“通过Expanse超级计算机,我们的目标是让科学家和研究人员能够像云计算一样来访问高性能计算机,而它可以处理从天体物理学到动物学之间的所有事情。第二代AMD EPYC处理器帮助我们实现了非凡的性能,让我们的研究人员可以做到更多的科学研究。我们与AMD也有着良好的合作关系,并一同为AMD HPC客户创建了一个论坛,在那里大家可以分享经验、信息,以便更好地获益于HPC研究。”
为百亿亿次级计算铺平道路
为了帮助研究人员迈向通往百亿亿次级计算的道路,AMD已经向橡树岭国家实验室提供了全新的AMD Instinct MI100加速显卡,它在计算和互连性能上带来了巨大的飞跃。从AMD的高性能计算到AI,Instinct MI100加速显卡实现了一种新型的加速系统,同时还可提供真正的异构计算能力。该加速显卡基于AMD Infinity架构,旨在可以与第二代AMD EPYC处理器进行互补,AMD Instinct MI100为AMD的HPC和AI计算提供了真正的异构计算能力。
橡树岭国家实验室科学主任Bronson Messer表示:“与当今的系统相比,基于AMD的Frontier的计算能力有了巨大的提升,它可以帮助科学家们得到我们过去不可得知的答案。例如其模拟分子运行的能力不只是几百万个原子,而是多达几十亿个原子,它为科学提供了一个更真实的表现,并且能够一次又一次地做到这一点很重要,这将为我们带来很多重大发现。”
无论是帮助研究中心的学生、改善汽车制造商的空气动力学效率,还是为医学突破提供有价值的关键见解,AMD将会继续为今天和未来的HPC工作负载提供所需的性能、能力和规模。
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。
主动型 AI 是人工智能的下一次进化,它不仅能生成内容,还能自主决策和追求目标。这种 AI 可以设定自己的目标,制定策略并根据情况调整方法,实现真正的自主性。它将彻底改变机器与世界的互动方式,为人机协作开启新的可能性,但也带来了透明度和伦理等挑战。