其关键在于选择、开放性和规模
Jeff McVeigh,英特尔副总裁兼超级计算事业部总经理
高性能计算(HPC)代表了当今技术的顶峰,现代一些最重要的发现都借助了这些先进的机器。现在,我们正站在新一代高性能计算的入口处,其技术的可扩展性和普遍性能够为我们的生活带来翻天覆地的变化。
这一点在抗击新冠肺炎疫情中表现得最为明显。疫情爆发之初,科研机构就在研究实验室以及“高性能计算即服务”的云环境中利用这些先进的超级计算机,来监测、研究、治疗新冠病毒,并运用此项技术开发了用于治疗新冠肺炎的药物。人们正以惊人的速度逐步实现这些目标,这离不开高性能计算技术的广泛应用。
其实在迎来E级运算时代之际,我们才刚刚起步。现阶段,超级计算已经推动了科学探索的发展,并能够帮助解决气候变化和慢性病治疗等关键问题。未来,它将有助于解决我们尚未遇到、甚至无法想象的问题和危机。
英特尔的目标是普及高性能计算并实现高性能计算普及化。为此,我们必须拥抱各种技术,以实现数量级的性能提升、转变高性能计算的可访问性并重新思考我们如何构建为这些系统提供动力的组件。基于此,我们以性能、开放性和规模作为策略基础。
性能:从无所不在的计算架构开始
x86架构是当今高性能计算的发动机,为绝大多数系统提供动力。庞大的安装量使开发人员和客户能够访问世界上最大的生态系统以支持和部署高性能计算工作负载。x86 架构还提供了始终如一的代际性能提升。
现有的这一代英特尔®至强®可扩展处理器已被我们的高性能计算生态系统合作伙伴广泛采用,而下一代英特尔至强可扩展处理器Sapphire Rapids也增加了新功能,目前也作为样品正提供给客户进行测试。Sapphire Rapids为高性能计算生态系统提供多种功能,首次封装了能够充分利用Sapphire Rapids多单元架构的高带宽内存HBM2e。Sapphire Rapids还带来了增强的性能、新的加速器、PCIe 5.0和其他针对人工智能、数据分析和高性能计算负载而优化的新功能。
高性能计算负载发展迅猛。它们变得更加多样化、专有化,也同时需要混合的异构架构。尽管x86架构仍然是标量负载的动力来源,但如果要想实现数量级的性能提升并进一步超越E级运算时代,就必须以批判性的思维来审视高性能计算负载在矢量、矩阵和空间架构中的运行方式,并且必须确保这些架构能够无缝地协同配合。
英特尔已经采用了“整体工作负载”策略,即针对特定负载的加速器和图形处理器(GPU),无论是硬件还是软件,都可以与中央处理器(CPU)无缝配合。我们正在通过下一代英特尔至强可扩展处理器和Xe HPC GPU(代号“Ponte Vecchio”)来实施该战略,它们将用于阿贡国家实验室的2百亿亿次级*极光(Aurora)超级计算机。Ponte Vecchio具备最高的单插槽和单节点计算密度,利用我们先进的封装技术即嵌入式多芯片互连桥接(EMIB)和Foveros封装了47个单元。Ponte Vecchio上运行着100多个高性能计算应用。我们还与包括ATOS、戴尔、惠普、联想、浪潮、Quanta以及超微在内的合作伙伴和客户合作,在他们最新的超级计算机上安装部署Ponte Vecchio处理器。
通过开放性实现高性能计算的普及
要想真正普及高性能计算并实现高性能计算普及化,就需要一种开放的协作方式。英特尔致力于提供基于行业标准的开放平台,以此促进广泛的协作。我们的目标是推动标准制定并创建关键硬件平台,让整个行业团结在一起,在此基础上进行开发。
众所周知,GPU编程由于缺乏适用标准而发展受阻。因此自从GPU进入高性能计算领域以来,行业就面临着CPU和GPU各有一个独立的软件堆栈的挑战,而oneAPI编程模式则试图打破这些孤岛。
oneAPI是一种开放、统一的跨架构编程模式,适用于CPU、GPU和诸如FPGA等的加速器架构,能够允许异构计算环境的编程,所有这些都使用一个代码库和软件堆栈。如此一来,开发人员只需跨架构编程一次,而且客户也不会受制于某个单独的供应商。
下个月,我们将发布英特尔® oneAPI 2022工具包。相比于去年12月份发布的oneAPI 2021版本,该款新的工具包增加了900多项新功能。通过第一个统一的C++/SYCL/Fortran 编译器和数据并行Python,即将发布的版本增加了面向CPU和GPU的跨架构开发功能。今天,我们还宣布建立另外两个oneAPI卓越中心,加入由领先的科研学术机构组成的蓬勃发展的全球生态系统,提供开源端口并扩展硬件支持、新技术、服务和课程,以推动oneAPI在生态系统内部的普及。
我们深知,要想真正普及高性能计算,还有很多工作有待完成。现阶段我们正在做的事将使人们能够在未来随时随地利用最新的高性能计算技术。
大规模制造:英特尔的IDM 2.0战略
高性能计算普及化需要规模效应。英特尔致力于提供推动创新和增长所需的组件和技术。通过英特尔IDM 2.0战略的差异化优势,我们能够带领高性能计算客户进入创新、制造和产品领先的新时代。
我们正在快速执行为期多年的 IDM 2.0战略,这对我们的高性能计算客户来说,是个大好消息,因为我们能够利用行业领先的制造能力以及我们在封装技术方面的领先地位来设计最好的产品,并使用最好的IP,提供下一个超级计算机时代所需的产品。
我们坚定不移地致力于实现高性能计算普及化这一承诺,为此我们也持续投入以推动技术进步来解决最棘手的问题。
当我们越来越接近新一代超级计算机的时候,我们能取得哪些成就?我无比期待答案的揭晓。
Jeff McVeigh是英特尔公司副总裁兼超级计算事业部总经理
1 巅峰性能
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。