以数据为中心 英特尔通过软硬结合加速HPC和AI融合

作者:李祥敬   【原创】   2019-11-19 16:24:25

关键字: AI HPC 英特尔

硬件产品品类的丰富,软件产品的打通,在这个以数据为中心的时代,英特尔正在加速HPC和AI融合,让企业在应对数据挑战方面更加得心应手。

至顶网计算频道 11月19日 新闻消息(文/李祥敬):在当前数据洪流下,企业对于计算的需求是巨大的,同时也是多样化的。在新的变革时代背景下,英特尔提出了以数据为中心的愿景,通过软硬件产品组合,从数据中心到云,驱动整个IT系统范式的变革,并以产品技术创新和广泛的生态优势,全方位推动高性能计算和人工智能的融合。

在近日举行的2019年超级计算大会(SC19)上,英特尔宣布其以数据为中心的芯片产品组合增添新的品类。新的产品不仅包括了一类专为高性能计算和人工智能融合优化的全新独立通用GPU,还包括全新软件行业计划oneAPI,助力充分释放高性能计算与人工智能技术融合时代多架构计算的潜力。

xPU——多样化的硬件产品

其实在SC19大会之前,英特尔在旧金山举行的2019英特尔人工智能峰会期间(Intel AI Summit 2019)上就展示了面向训练(NNP-T1000)和面向推理(NNP-I1000)的英特尔Nervana神经网络处理器(NNP)。作为英特尔为云端和数据中心客户提供的首个针对复杂深度学习的专用ASIC芯片,英特尔Nervana NNP具备超高扩展性和超高效率。英特尔还发布了下一代英特尔Movidius Myriad视觉处理单元(VPU),用于边缘媒体、计算机视觉和推理应用。

以数据为中心 英特尔通过软硬结合加速HPC和AI融合

以数据为中心 英特尔通过软硬结合加速HPC和AI融合

不管是Nervana NNP还是Movidius VPU,英特尔展示的这一系列新产品,旨在加速从云端到边缘的人工智能系统开发和部署,迎接下一波人工智能浪潮的到来。如今,得益于三大趋势的成熟——数据科学的新突破、训练数据的指数增长、计算力的不断提升,人工智能正走向历史转折点,得到前所未有的大规模采用。高性能计算也正在加速这一势头,将AI的强大功能应用于现有的高性能计算工作流程,也扩展了人工智能算法的规模,以充分利用高性能计算系统的能力。同时,高性能计算和AI的融合,将从架构灵活性、扩展的内存存储层级结构、软件抽象化等方面变革IT系统范式。

英特尔的芯片产品组合由部署在各类芯片平台上的多种架构组成。英特尔以数据为中心的产品组合提供了构建先进计算系统的根基,使得这些系统能够传输、存储和处理海量数据,更可以将高性能计算数据分析和人工智能加速整合到单一的计算环境中,并提供新的内存和存储模式为计算引擎提供支持,进而解决高性能计算系统面临的独特挑战。

英特尔至强可扩展处理器是英特尔以数据为中心战略的基石,支持着目前全球超算500强中超过90%的超级计算机。英特尔至强可扩展处理器同时也是唯一一款内置人工智能加速的x86处理器,并针对高性能计算工作负载中大量数据集的分析进行了优化。

以数据为中心 英特尔通过软硬结合加速HPC和AI融合

显然对于英特尔而言,面对多样化的工作负载,一个丰富的产品组合是必不可少的,比如CPU、通用GPU、FPGA到NNP。在SC19上,英特尔展示了一款基于全新架构的全新类别的通用GPU。这款兼具高性能、高灵活性的独立通用GPU,研发代号为“Ponte Vecchio”,专为高性能计算建模、模拟工作负载以及人工智能训练而设计。

Ponte Vecchio将采用英特尔7纳米工艺进行制造,并将成为英特尔首款基于全新架构的GPU,可为高性能计算和人工智能工作负载进行优化。它采用英特尔Foveros 3D和嵌入式多芯片互连桥接(EMIB)创新封装技术,以及多种其它技术,如高带宽存储器、CXL互连技术以及其它专利技术。

在笔者看来,GPU产品的补位让英特尔真正具备了端到端的产品构建能力。随着当今世界以数据为中心的工作负载日益多样化,处理数据的架构也日益多样化。英特尔提出了SVMS的架构,也就是覆盖标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial)。现在的计算架构已经从CPU时代往XPU方向发展,也就是从原来比较流行的CPU(向量计算)向GPU(矢量计算)、AI(矩阵计算)和FPGA(空间计算)发展。GPU产品的加入让英特尔成为提供SVMS全系产品的厂商。

之所以英特尔提出以数据为中心而不是以前的以CPU为中心,是当前产业变革的结果。单一的CPU已经无法支撑日渐多样化的工作负载,这个时代是“专业的人做专业的事”,对于计算架构也是如此。如果将各种功能不断叠加到CPU只会让CPU变得更加“庞大”,以数据为中心,代表了英特尔将众多专属功能卸载到多样化的产品中。

虽然我们能看到在最新一代的英特尔至强可扩展处理器中加入了全新的AVX-512以及VNNI等指令集来加速AI工作负载,但是这些更加侧重AI推理方面。在AI训练方面,GPU架构依然有着不同的优势。这次英特尔基于全新架构的的GPU产品显然与新一代至强可扩展处理器是一种“珠联璧合”。

日渐丰富的产品为英特尔客户提供了更加多样化的选择,毕竟海量的英特尔客户为新产品提供了很好的基础,也易于用户将其引入到已有的IT系统中,无缝融合已有计算架构这才是最大的想象空间。笔者此前采访过一些AI创业公司或者用户,他们之所以选择英特尔架构,就是看中了英特尔生态,不管是在成本还是丰富性方面为他们进行业务创新提供了更多选择。

另外,我们注意到不管是ISC还是SC或者HPC China的榜单,其实英特尔架构与加速器的组合是常态,那在英特尔推出自己的GPU产品后,其实CPU与GPU的打通更加容易,而且与英特尔傲腾技术实现无缝集成,这样HPC的计算、存储和网络的瓶颈就会打破。毕竟HPC是一个系统,不存在单点瓶颈,需要整体打通。当这些都是“Intel inside”的产品在一起协同工作的时候,其产生的效应肯定不是简单相加,而是一种乘数效果。

oneAPI——软件的指数级提升

如果说硬件产品的丰富很是振奋人心,其实英特尔在软件方面的开拓更为震撼。在SC19上,英特尔发布了一项全新软件行业计划oneAPI。

以数据为中心 英特尔通过软硬结合加速HPC和AI融合

英特尔oneAPI行业计划,为跨多种包括CPU、GPU、FPGA和其他加速器在内的异构计算,提供了一个统一和简化的应用程序开发编程模型。oneAPI的发布源自英特尔数百万小时软件工程开发的努力,并且标志着一个行业内的变革,从今天受限、封闭的编程方法演变到一个开放的、基于标准的模式,助力开发人员实现跨架构的参与和创新,为全球开发人员提供一座从现有代码和技能过渡到即将来临的xPU时代的桥梁。

以数据为中心 英特尔通过软硬结合加速HPC和AI融合

oneAPI是一个以开发者为中心的平台,将为AI应用无处不在、多架构并存的世界重新定义一种新的编程方式。oneAPI提供一个通用、开放的编程体验,让开发者可以自由选择架构,无需在性能上作出妥协,也大大降低了使用不同的代码库、编程语言、编程工具和工作流程所带来的复杂性。oneAPI保留了现有软件投资,包括支持现有语言,同时为开发人员创造更多丰富的应用程序提供了灵活性。

跨架构(CPU、GPU、FPGA及其他加速器)开发能力对于处理数据密集型工作负载极为重要,因为这种工作负载需要多种架构,这也将成为未来的常态。在今天,每一个硬件平台往往需要开发者维护独立的代码库,这些代码库需要使用不同的语言、库和软件工具进行编程。这是一项极其复杂和耗费时间的工作,会大大降低开发速度、抑制创新。

为了解决这一难题,oneAPI提供一个通用、开放的编程体验,让开发者可以自由选择架构,无需在性能上作出妥协,也大大降低了使用不同的代码库、编程语言、编程工具和工作流程所带来的复杂性。相对于今天的基于单个厂商的封闭式编程环境,oneAPI为开发者提供了极富竞争力、也更先进的可替代选择,帮助他们在保留现有软件投资的基础上,搭建一座无缝连接的桥梁,从而为未来的多架构世界创造更多丰富的应用程序。

oneAPI包括了一项基于开放规范的行业计划,该规范包括一种编程语言、强大的API函数库以及底层硬件接口。oneAPI产品为开发者提供了全套的开发工具,包括编译器、编程库、分析器等,并把这些工具封装为特定领域的工具包。开发人员从现在开始就可以在英特尔DevCloud for oneAPI上对基于多种英特尔架构(包括英特尔至强可扩展处理器、带集成显卡的英特尔酷睿处理器、英特尔FPGA如英特尔Arria、Stratix等)的代码和应用进行测试。

在我们的印象中,英特尔是一家硬件公司,但是英特尔在软件方面的深厚基础才是其硬件创新的重要支撑。英特尔已经深入开发者生态领域超过20年。英特尔拥有15000多名软件工程师和10000项与客户紧密合作的软件部署,是Linux Kernel最大的贡献者,每年修改的代码超过50万行,为100多个操作系统进行过优化,并且拥有超过两千万活跃开发者的生态,而这些只是英特尔庞大的软件实力的一部分。英特尔跨基础架构、网络、操作系统的开发经验,开发工具和SDK以及其所参与并影响的标准制定组织的数量在业界是无与伦比的。

为了迎接以数据为中心的挑战,英特尔提出了扎根于六大技术支柱——制程和封装,架构,内存和存储,互连,安全,软件的全新的产品和技术战略。针对软件这一技术支柱,英特尔认为,对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来两个数量级的性能提升。对于开发者来说,拥有一套利用好英特尔芯片的通用工具集,对于获得性能的指数级扩展至关重要。

在这样的思考下,oneAPI横空出世。oneAPI支持直接编程和API编程,并将提供统一的语言和库,可以在包括CPU、GPU、FPGA和AI加速器等不同硬件上,提供完整的本地代码性能。oneAPI的简单易用和高性能让开发者不再需要维护不同的代码库、多种编程语言以及不同的工具和工作流程。

此前英特尔亚太研发中心总经理卢炬告诉笔者,如果光通过开发和优化硬件,那么,性能的提高可能远远达不到现在以数据为中心的战略需求。如果想要实现指数级的增长,一定要软硬件协同。英特尔软件也是推动未来计算创新的隐形力量。因为整个计算架构不是原来的单一CPU架构,需要针对不同的架构和负载进行整合,软件在中间起了一个最关键的桥梁作用。

卢炬说,对于英特尔软件部门来说,实现软硬协同、生态共赢需要做好以下事情:提供简便可扩展的工具,来加速应用开发部署;坚持客户至上,针对不同类型的工作负载进行优化;秉承开放理念,推动开源、开放生态系统协作;产学研对接,培育面向未来的创新人才。所以,oneAPI在软件上的加持让英特尔在推动高性能计算与人工智能技术融合方面有了更强的抓手。

结语

硬件产品品类的丰富,软件产品的打通,在这个以数据为中心的时代,英特尔正在加速HPC和AI融合,让企业在应对数据挑战方面更加得心应手。

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:010-62641205-5060 举报email:jubao@zhiding.cn 安全联盟认证