加速创新,打造更具可持续性和开放性的HPC

英特尔公布了直到2024年的高性能计算产品路线图,期间我们将致力于提供多样化的异构架构。这些架构不仅将使我们能够实现几个数量级的性能提升,同时亦可降低通用工作负载及诸如人工智能、加密、分析等新兴工作负载的能耗。

接下来的超算普及化时代,英特尔将满足永无止境的计算需求,并将可持续发展作为重中之重。

加速创新,打造更具可持续性和开放性的HPC

本文作者:Jeff McVeigh英特尔副总裁兼超级计算事业部总经理

随着我们进入 E 级(Exascale)计算时代并迈向 Z 级(Zettascale)计算时代,科技行业也越来越影响着全球的碳排放。据估计,到 2030 年数据中心的能耗估计将达到全球能源产量的 3%-7%1,而计算基础设施将成为新增用电量的主要驱动因素。

今年,英特尔承诺到 2040 年实现全球业务的温室气体净零排放,并开发更加可持续的技术解决方案。在创造可持续未来的同时满足对计算永无止境的需求,这是高性能计算(HPC)面临的最大挑战之一。这个任务虽然艰巨,但如果我们能够把芯片、软件和系统这些 HPC计算堆栈的每个部分都做好,它就是可以实现的。

我在德国汉堡举行的 2022 国际超算大会(ISC 2022)上发表了主题演讲,上述内容就是我在演讲中传达的核心信息。

从芯片和异构计算架构开始

英特尔公布了直到 2024 年的高性能计算产品路线图,期间我们将致力于提供多样化的异构架构。这些架构不仅将使我们能够实现几个数量级的性能提升,同时亦可降低通用工作负载及诸如人工智能、加密、分析等新兴工作负载的能耗。

以内置高带宽内存(HBM),代号为 Sapphire Rapids的英特尔® 至强® 处理器为例,该款处理器能够很好地展示我们如何利用先进的封装技术和芯片创新,为高性能计算带来性能、带宽和节能方面的显著提升。通过封装高达 64 GB 的高带宽内存 HBM2e 并把加速器集成到 CPU 中,我们能够释放内存敏感型工作负载的潜力,为这些关键的高性能计算应用场景大幅提升性能。在对比第三代英特尔® 至强® 可扩展处理器和即将推出的内置高带宽内存(HBM)的 Sapphire Rapids 处理器时,我们发现,后者把气候研究、能源、制造和物理学工作负载的性能提升了 2-3倍2。在主题演讲中,Ansys 首席技术官 Prith Banerjee还展示了内置高带宽内存的 Sapphire Rapids 为 Ansys Fluent 和 ParSeNet 的实际工作负载带来了高达 2 倍的性能提升3

为实现跨 HPC 和 AI 超算工作负载的几个数量级的性能提升,计算密度是另一必不可少的要素。代号为 Ponte Vecchio 的英特尔首个旗舰级数据中心图形处理器(GPU),已经在复杂的金融服务应用以及 AI 推理和训练工作负载方面展现出了卓越的优势。

创新不止于此。今天,我们还宣布这款出色数据中心 GPU 的下一代产品代号为Rialto Bridge。通过升级 Ponte Vecchio 架构,并结合使用下一代制程节点技术制造的增强型芯片子模块,Rialto Bridge 将大幅提高计算密度、性能和效率,同时提供软件一致性。

加速创新,打造更具可持续性和开放性的HPC

展望未来,Falcon Shores 是我们路线图中下一个重要的架构创新,即把 x86 CPU 和 Xe  GPU 集成在同一插槽中。这一架构计划将在 2024 年推出,它将在每瓦性能、计算密度、内存容量与带宽方面均实现超过 5 倍的性能提升4

加速创新,打造更具可持续性和开放性的HPC

成功的软件战略遵循三个原则:开放、选择、信任

如果没有软件为芯片注入活力,它将仅仅只是砂砾。英特尔的软件策略是促进整个堆栈的开放式发展,并提供工具、平台和软件 IP,以帮助开发者提升工作效率,产出可扩展、更高性能、更高效的代码,这些代码能充分利用最新的芯片创新,没有重构代码的负担。oneAPI行业计划为 HPC 开发者提供了跨架构编程,使代码能透明、可迁移地适用于 CPU、GPU 和其他专用加速器。

加速创新,打造更具可持续性和开放性的HPC

目前,在世界各地领先的科研和学术机构中已有 20 多个 oneAPI 卓越中心(CoE),它们正取得重要的进展。例如,布里斯托大学科学系的 Simon McIntosh-Smith 和他的团队,正在使用 oneAPI 和 Khronos Group 的 SYCL 抽象层进行跨架构编程,为在 E 级计算规模上实现性能可移植性开发最佳实践。他们的工作将确保科学代码能在大规模异构超算系统上实现高性能。

聚力整合:实现可持续的异构计算

随着数据中心和 HPC 工作负载越来越多采用分布式架构和异构计算,我们需要借助工具来帮助有效管理和应对复杂多样的计算环境。

今天,我们将推出一款开源解决方案 Intel® XPU Manager,它可以在本地或远程监测和管理英特尔数据中心 GPU。该解决方案旨在简化管理,并通过综合诊断更好地实现可靠性和延长设备运行时间,以及提升利用率并支持固件更新。

针对能耗很高的数据传输和存储任务,分布式异步对象存储(DAOS)文件系统提供了系统级的优化。DAOS 可以显著地改善文件系统的性能,它不仅可以缩短整体访问时间,而且能够降低存储所需的容量,从而减少数据中心的占用空间并提高能源效率。相比于 Lustre 在 I/O 500 中的测试结果,DAOS 实现了直接写入文件系统性能 70 倍5的提升。

应对HPC的可持续性挑战

我们很荣幸能够与全球志同道合的客户和行业领先的科研机构合作,朝着实现更具可持续性和开放性的高性能计算而努力。我们近期取得了一系列成果——我们与巴塞罗那超算中心合作建立了开创性的 RISC-V Z 级计算实验室;并与剑桥大学和戴尔继续合作,将当前的 E 级计算实验室进一步打造成为新的剑桥 Z 级计算实验室。

独木难支,完整生态的构建需要在制造、芯片、互连、软件和系统等各方面携手共进。通过与整个生态的协作,我们致力于将本世纪最大的 HPC 挑战转化为前所未有的机遇,创造改变世界的技术,让未来更美好。

##

注意事项与免责声明:

1 《对2020年至2030年期间全球计算机的一次能源使用、电力使用和二氧化碳排放及其所占份额的假设》,作者:Anders S.G. Andrae,《WSEAS电力系统汇刊》,15 (2020)

2 测量依据如下:

CloverLeaf

  • 由英特尔于2022年4月26日测试。1节点,2个英特尔®至强®铂金 8360Y CPU,72个内核,超线程开启,睿频开启,总内存256GB(16x16GB DDR4 3200 MT/s),SE5C6200.86B.0021.D40.2101090208,Ubuntu 20.04,Kernel 5.10,0xd0002a0,ifort 2021.5,Intel MPI 2021.5.1,编译器参数:-xCORE-AVX512-qopt-zmm-usage=high
  • 由英特尔于2022年4月19日测试。1节点,2个早期的英特尔®至强®可扩展处理器测试样品,代号为Sapphire Rapids + HBM,40个以上内核,超线程开启,睿频开启,总内存128 GB(HBM2e以3200MHz的频率运行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode 版本=0x83000200,CentOS Stream 8,Linux 版本5.16,ifort 2021.5,Intel MPI 2021.5.1, 编译器参数:-xCORE-AVX512 –qopt-zmm-usage=high

OpenFOAM

  • 由英特尔于2022年1月26日测试。1节点,2个英特尔®至强®铂金 8380 CPU,80个内核,超线程开启,睿频开启,总内存256GB(16x16GB 3200MT/s,双面),BIOS版本SE5C6200.86B.0020.P23.2103261309,0xd000270,Rocky Linux 8.5 ,Linux版本4.18.,OpenFOAM® v1912,Motorbike 28M @ 250次迭代;编译说明:工具:Intel Parallel Studio 2020u4,编译器参数:-O3 -ip -xCORE-AVX512
  • 由英特尔于2022年1月26日测试。1节点,2个早期的英特尔®至强®可扩展处理器测试样品,代号为Sapphire Rapids + HBM,40个以上内核,超线程关闭,睿频关闭,总内存128GB(HBM2e以3200MHz的频率运行),试生产的平台和BIOS,CentOS 8,Linux版本5.12,OpenFOAM® v1912,Motorbike 28M @ 250次迭代;编译说明:工具:Intel Parallel Studio 2020u4,编译器参数:-O3 -ip -xCORE-AVX512

WRF

  • 由英特尔于2022年5月3日测试。1节点,2个英特尔®至强® 8380 CPU,80个内核,超线程开启,睿频开启,总内存256GB(16x16GB 3200MT/s,双面),BIOS版本SE5C6200.86B.0020.P23.2103261309,ucode版本=0xd000270,Rocky Linux 8.5,Linux版本4.18,WRF v4.2.2
  • 由英特尔于2022年5月3日测试。1节点,2个早期的英特尔®至强®可扩展处理器测试样品,代号为Sapphire Rapids + HBM,40个以上内核,超线程开启,睿频开启,总内存128GB(HBM2e以3200MHz的频率运行),BIOS版本EGSDCRB1.86B.0077.D11.2203281354,ucode 版本=0x83000200,CentOS Stream 8,Linux版本5.16,WRF v4.2.2

YASK

  • 由英特尔于2022年5月9日测试。1节点,2个英特尔®至强®铂金 8360Y CPU,72个内核,超线程开启,睿频开启,总内存256GB(16x16GB DDR4 3200 MT/s ),SE5C6200.86B.0021.D40.2101090208,Rocky linux 8.5,Kernel 4.18.0,0xd000270,编译器参数:make -j YK_CXX='mpiicpc -cxx=icpx' arch=avx2 stencil=iso3dfd radius=8,
  • 由英特尔于2022年5月3日测试。1节点,2个早期的英特尔®至强®可扩展处理器测试样品,代号为Sapphire Rapids + HBM,40个以上内核,超线程开启,睿频开启,总内存128GB(HBM2e以3200MHz的频率运行),BIOS版本EGSDCRB1.86B.0077 .D11.2203281354,ucode版本 =0x83000200,CentOS Stream 8,Linux 版本 5.16,编译器参数:make -j YK_CXX='mpiicpc -cxx=icpx' arch=avx2 stencil=iso3dfd radius=8,

3 Ansys Fluent

  • 由英特尔于2022年2月测试。1节点,2个英特尔®至强®铂金 8380 CPU,80个内核,超线程开启,睿频开启,总内存256GB(16x16GB 3200MT/s,双面),BIOS版本SE5C6200.86B.0020.P23.2103261309,ucode版本=0xd000270,Rocky Linux 8.5 ,Linux版本4.18,Ansys Fluent 2021 R2 Aircraft_wing_14m;编译说明:商业版本使用Intel 19.3编译器和Intel MPI 2019u
  • 由英特尔于2022年2月测试。1节点,2个早期的英特尔®至强®可扩展处理器测试样品,代号为Sapphire Rapids + HBM,40个以上内核,超线程关闭,睿频关闭,总内存128GB(HBM2e以3200MHz的频率运行),预生产的平台和BIOS,CentOS 8,Linux版本5.12,Ansys Fluent 2021 R2 Aircraft_wing_14m;编译说明:商业版本使用Intel 19.3编译器和Intel MPI 2019u8

Ansys ParSeNet

  • 由英特尔于2022年5月24日测试。1节点,2个英特尔®至强®铂金 8380 CPU,80个内核,超线程开启,睿频开启,总内存256GB(16x16GB DDR4 3200 MT/s [3200 MT/s]),SE5C6200.86B.0021 .D40.2101090208,Ubuntu 20.04.1 LTS,5.10,ParSeNet (SplineNet),PyTorch 1.11.0,Torch-CCL 1.2.0,IPEX 1.10.0,MKL (2021.4-Product Build 20210904),oneDNN (V2.5.0)
  • 由英特尔测试于2022年4月18日。1节点,2个早期的英特尔®至强®可扩展处理器测试样品,代号为Sapphire Rapids + HBM,112个内核,超线程开启,睿频开启,总内存128GB(HBM2e 3200 MT/s),EGSDCRB1.86B.0077 .D11.2203281354,CentOS Stream 8,5.16,ParSeNet (SplineNet),PyTorch 1.11.0,Torch-CCL 1.2.0,IPEX 1.10.0,MKL (2021.4-Product Build 20210904),oneDNN (v2.5.0)

Falcon Shores 的性能目标基于截至 2022 年 2 月相对于当前平台的预测。 结果可能有所不同。

5 结果可能有所不同。更多信息请访问 io500 和 YouTube视频《DAOS与Lustre的性能对比测试》

所有产品计划和路线图可能更改,恕不另行通知。

英特尔不控制或审核第三方数据。在评估数据准确性时,请参考其他信息源。

英特尔技术可能需要已启用的硬件、软件或激活服务。

实际性能受使用情况、配置和其他因素的差异影响。更多信息请访问:http://www.intel.com/PerformanceIndex。

性能结果基于配置信息中显示的日期进行测试,且可能并未反映所有公开可用的更新。配置详情见备用信息。没有任何产品或组件能够保证绝对安全。

您的成本和结果可能有所不同。

本文中有关未来计划或预期的陈述均为前瞻性陈述。此类陈述基于当前的预期,涉及若干风险和不确定,并可能导致实际结果与这些前瞻性陈述中明示或隐含的内容之间存在重大差异。欲进一步了解有关可能导致实际结果出现重大差异的因素,请参见我们最近发布的收益报告和美国证券交易委员会文件,网站:http://www.intc.com

来源:业界供稿

0赞

好文章,需要你的鼓励

2022

06/06

10:29

分享

点赞

邮件订阅