其关键在于选择、开放性和规模
Jeff McVeigh,英特尔副总裁兼超级计算事业部总经理
高性能计算(HPC)代表了当今技术的顶峰,现代一些最重要的发现都借助了这些先进的机器。现在,我们正站在新一代高性能计算的入口处,其技术的可扩展性和普遍性能够为我们的生活带来翻天覆地的变化。
这一点在抗击新冠肺炎疫情中表现得最为明显。疫情爆发之初,科研机构就在研究实验室以及“高性能计算即服务”的云环境中利用这些先进的超级计算机,来监测、研究、治疗新冠病毒,并运用此项技术开发了用于治疗新冠肺炎的药物。人们正以惊人的速度逐步实现这些目标,这离不开高性能计算技术的广泛应用。
其实在迎来E级运算时代之际,我们才刚刚起步。现阶段,超级计算已经推动了科学探索的发展,并能够帮助解决气候变化和慢性病治疗等关键问题。未来,它将有助于解决我们尚未遇到、甚至无法想象的问题和危机。
英特尔的目标是普及高性能计算并实现高性能计算普及化。为此,我们必须拥抱各种技术,以实现数量级的性能提升、转变高性能计算的可访问性并重新思考我们如何构建为这些系统提供动力的组件。基于此,我们以性能、开放性和规模作为策略基础。
性能:从无所不在的计算架构开始
x86架构是当今高性能计算的发动机,为绝大多数系统提供动力。庞大的安装量使开发人员和客户能够访问世界上最大的生态系统以支持和部署高性能计算工作负载。x86 架构还提供了始终如一的代际性能提升。
现有的这一代英特尔®至强®可扩展处理器已被我们的高性能计算生态系统合作伙伴广泛采用,而下一代英特尔至强可扩展处理器Sapphire Rapids也增加了新功能,目前也作为样品正提供给客户进行测试。Sapphire Rapids为高性能计算生态系统提供多种功能,首次封装了能够充分利用Sapphire Rapids多单元架构的高带宽内存HBM2e。Sapphire Rapids还带来了增强的性能、新的加速器、PCIe 5.0和其他针对人工智能、数据分析和高性能计算负载而优化的新功能。
高性能计算负载发展迅猛。它们变得更加多样化、专有化,也同时需要混合的异构架构。尽管x86架构仍然是标量负载的动力来源,但如果要想实现数量级的性能提升并进一步超越E级运算时代,就必须以批判性的思维来审视高性能计算负载在矢量、矩阵和空间架构中的运行方式,并且必须确保这些架构能够无缝地协同配合。
英特尔已经采用了“整体工作负载”策略,即针对特定负载的加速器和图形处理器(GPU),无论是硬件还是软件,都可以与中央处理器(CPU)无缝配合。我们正在通过下一代英特尔至强可扩展处理器和Xe HPC GPU(代号“Ponte Vecchio”)来实施该战略,它们将用于阿贡国家实验室的2百亿亿次级*极光(Aurora)超级计算机。Ponte Vecchio具备最高的单插槽和单节点计算密度,利用我们先进的封装技术即嵌入式多芯片互连桥接(EMIB)和Foveros封装了47个单元。Ponte Vecchio上运行着100多个高性能计算应用。我们还与包括ATOS、戴尔、惠普、联想、浪潮、Quanta以及超微在内的合作伙伴和客户合作,在他们最新的超级计算机上安装部署Ponte Vecchio处理器。
通过开放性实现高性能计算的普及
要想真正普及高性能计算并实现高性能计算普及化,就需要一种开放的协作方式。英特尔致力于提供基于行业标准的开放平台,以此促进广泛的协作。我们的目标是推动标准制定并创建关键硬件平台,让整个行业团结在一起,在此基础上进行开发。
众所周知,GPU编程由于缺乏适用标准而发展受阻。因此自从GPU进入高性能计算领域以来,行业就面临着CPU和GPU各有一个独立的软件堆栈的挑战,而oneAPI编程模式则试图打破这些孤岛。
oneAPI是一种开放、统一的跨架构编程模式,适用于CPU、GPU和诸如FPGA等的加速器架构,能够允许异构计算环境的编程,所有这些都使用一个代码库和软件堆栈。如此一来,开发人员只需跨架构编程一次,而且客户也不会受制于某个单独的供应商。
下个月,我们将发布英特尔® oneAPI 2022工具包。相比于去年12月份发布的oneAPI 2021版本,该款新的工具包增加了900多项新功能。通过第一个统一的C++/SYCL/Fortran 编译器和数据并行Python,即将发布的版本增加了面向CPU和GPU的跨架构开发功能。今天,我们还宣布建立另外两个oneAPI卓越中心,加入由领先的科研学术机构组成的蓬勃发展的全球生态系统,提供开源端口并扩展硬件支持、新技术、服务和课程,以推动oneAPI在生态系统内部的普及。
我们深知,要想真正普及高性能计算,还有很多工作有待完成。现阶段我们正在做的事将使人们能够在未来随时随地利用最新的高性能计算技术。
大规模制造:英特尔的IDM 2.0战略
高性能计算普及化需要规模效应。英特尔致力于提供推动创新和增长所需的组件和技术。通过英特尔IDM 2.0战略的差异化优势,我们能够带领高性能计算客户进入创新、制造和产品领先的新时代。
我们正在快速执行为期多年的 IDM 2.0战略,这对我们的高性能计算客户来说,是个大好消息,因为我们能够利用行业领先的制造能力以及我们在封装技术方面的领先地位来设计最好的产品,并使用最好的IP,提供下一个超级计算机时代所需的产品。
我们坚定不移地致力于实现高性能计算普及化这一承诺,为此我们也持续投入以推动技术进步来解决最棘手的问题。
当我们越来越接近新一代超级计算机的时候,我们能取得哪些成就?我无比期待答案的揭晓。
Jeff McVeigh是英特尔公司副总裁兼超级计算事业部总经理
1 巅峰性能
好文章,需要你的鼓励
尽管2026年智能手机外观可能变化不大,但内部技术正发生飞跃式进步。AI原生处理器、新型连接技术和先进显示系统正将日常设备转变为具备企业级功能的强大个人平台。这些趋势对企业和消费者同样重要,因为人们携带的手机决定了他们如何访问数据、协作办公、管理工作流程和使用数字服务。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
《时代》杂志宣布AI及其架构师为2025年度人物,包括扎克伯格、苏姿丰、马斯克等八位科技领袖。编辑认为今年是AI全面潜力显现的关键年份,这项技术加速了医学研究和生产力提升,让不可能变为可能。从企业高管到教师学生,所有人都在思考AI对生活的颠覆性影响。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。