至顶网计算频道 09月04日 新闻消息(文/李祥敬):近日,2019 CCF全国高性能计算学术年会在内蒙古呼和浩特市举行。本届大会以“计算 见智 赢未来”为主题,聚焦E级计算机研制挑战、HPC重大应用等主题展开,汇聚业界前沿学术与应用动态。作为计算创新的引领者,英特尔在会上分享了对于高性能计算(HPC)和人工智能(AI)融合趋势的最新见解,阐释了英特尔凭借以数据为中心的产品组合变革高性能计算、转变IT系统范式的洞察和实践,并展现了与产、学、研各界的深度合作。
英特尔公司数据中心事业部副总裁兼E级计算业务总经理Trish A. Damkroger表示,在这个以数据为中心的世界,先进的高性能计算系统同时借助传统的高性能计算数据分析和人工智能技术,来高效处理最为复杂的科学问题。英特尔通过以数据为中心的软硬件产品组合,从数据中心到云,驱动整个IT系统范式的变革,并以产品技术创新和广泛的生态优势,全方位推动高性能计算和人工智能的融合。
当前,高性能计算(HPC)经过一代又一代的不断进化和迭代,特别是随着人工智能应用的快速崛起,更使得HPC不仅在科学计算领域的贡献日益突出,同时也被人们广泛应用于自然语言、图像识别、自动驾驶等人工智能的新领域。从这个角度来看,HPC和AI不仅有着天然的联系,如今更处在加速融合之中。换句话说,HPC不仅可以助推人工智能的快速发展,更随着人工智能的不断成熟,又反过来促进了HPC系统更好的部署和应用。
得益于三大趋势的成熟——数据科学的新突破、训练数据的指数增长、计算力的不断提升,人工智能正走向历史转折点,得到前所未有的大规模采用。高性能计算也正在加速这一势头,将AI的强大功能应用于现有的高性能计算工作流程,也扩展了人工智能算法的规模,以充分利用高性能计算系统的能力。同时,高性能计算和AI的融合,将从架构灵活性、扩展的内存存储层级结构、软件抽象化等方面变革IT系统范式。
Trish告诉记者,一方面,在硬件平台创新方面,英特尔的高性能计算技术包含许多创新,可帮助客户从最苛刻的人工智能工作负载中获得最大收益;另一方面,在算法和框架方面,英特尔也针对常见的人工智能框架进行了优化。通过对硬件平台创新和对算法和框架的支持,英特尔让AI和HPC应用能够平稳、高效地运行在统一的基础设施平台之上。
英特尔公司数据中心事业部副总裁兼E级计算业务总经理Trish A. Damkroger
先进的高性能计算系统同时借助传统的高性能计算数据分析和人工智能技术,来高效处理最为复杂的科学问题。然而随着高性能计算系统对计算性能的要求越来越高,内存带宽日益成为一个瓶颈。英特尔以数据为中心的产品组合通过将高性能计算数据分析和人工智能加速整合到一个单一的计算环境中,并提供新的内存和存储模式为计算引擎提供支持,进而解决高性能计算系统面临的独特挑战。
这其中,英特尔至强铂金9200处理器专为高性能计算、高级人工智能和分析而设计,它集成英特尔深度学习加速(英特尔DL Boost)技术,AI性能相比上一代至强可扩展处理器提高多达30倍。英特尔至强铂金9200处理器为广泛的工作负载提供领先的性能,诸如科学模拟、财务分析、人工智能/深度学习、3D建模与分析、密码学和数据压缩等场景。此外,英特尔至强铂金9200处理器借助英特尔数据中心模块,可以实现四大优势:降低配置和流程的复杂程度、享受高级定制化服务的放心部署、降低总拥有成本以及集中力量实现增值从而加快上市速度。
在Trish看来,拥有的算力并不代表是能被使用的计算能力。对超算中心很多用户来说,更重要的是能帮他解决问题。从长远来看,英特尔在软件或硬件架构上的优化会使最终用户的应用使用起来更加有效。"我之前在劳伦斯利弗莫尔国家实验室担任主任的时候,实验室最受研究员欢迎的机器是基于英特尔架构的机器,因为最容易使用,代码最容易优化,更快地解决研究员的科学问题。从这个角度来说,基于英特尔的系统提供了很多优势。"
除了英特尔至强可扩展处理器产品平台,英特尔进一步加快英特尔傲腾数据中心级持久内存在高性能计算系统中的应用,并宣布了一项针对超算推出的,利用英特尔傲腾数据中心级持久内存和分布式异步对象存储(DAOS)的革命性全新存储架构。其中,DAOS是一种提供高带宽、低延迟和高I/O操作的开源软件定义横向扩展对象存储,专为高性能计算和人工智能工作负载的融合而设计。这一全新的软件定义存储引擎消除了目前并行文件系统中的若干局限性。
Trish说,企业现在需要更多的计算,更多的内存,更多的存储,从这个层面上来讲,原来承载HPC的基础设施能够很大程度上满足一部分需求。所以其实你会看到硬件资源是一样的,但是软件层现在挑战是比较大的。
在软件层面,One API将提供一个统一的编程模型,以简化多样化计算架构上的应用开发。同时,英特尔的One API将基于行业标准和开放规范,并可以与OpenMP、MPI和Fortran等进行交互操作。“在高性能运算与人工智能的融合方面,英特尔投入了大量的人力和物力在软件和硬件方面。这些软件和硬件的投资和优化可以保证高性能运算还有包括像人工智能和大数据分析的融合应用运行。”
其实除了丰富的产品组合,英特尔在HPC与AI融合生态方面也进行了积极布局。Trish表示,建设生态系统是一个很复杂的过程,除了产品,英特尔在高性能业界耕耘了20年,积累了大量的经验和方法论,这些都可以丰富生态系统。另外,英特尔通过开源或者是开放标准的方式,能够给生态系统的合作伙伴带来最大的活力。
值得一提的是,英特尔始终不遗余力地支持高性能计算领域的创新合作和人才培养。多年来,英特尔全力支持全国并行应用挑战赛(Parallel Application Challenge),提供硬件基础设施、软件工具以及培训指导服务,以培养更多的高性能计算人才,挖掘更多高性能计算创新应用。作为主办单位,英特尔今年继续支持全国并行应用挑战赛,并通过提供一系列创新的计算平台及软件工具层的服务生态,携手更多科研机构与高校,一同推动国内超算技术的应用发展。
在生态系统中,我们不得不谈一下英特尔的合作伙伴,联想和浪潮。联想数据中心集团全球高性能计算和人工智能技术高级总监Scott Tease告诉记者,联想和英特尔有着非常强的战略合作关系。如今,全球最快的500台超级计算机中,横跨19个市场的173台都运行在联想的服务器上。此外,全球排名前25的研究型大学中有17所高校使用联想的基础设施,而这些机器是基于英特尔架构的。“现在超算中心不仅是看CPU的能力,更多还会看其他的方面,包括存储能力,从这个角度来说,英特尔在超算领域里提供了最丰富的产品线。”
联想数据中心集团全球高性能计算和人工智能技术高级总监Scott Tease
就在最近,英特尔与联想宣布开展为期多年的合作,关注于高性能计算(HPC)和人工智能(AI)融合领域快速增长的机会,双方关注三个领域:系统和解决方案、针对高性能计算和人工智能融合的软件优化以及支持生态系统。
Scott表示,联想最大的优势是能够帮助客户把不同的技术实现落地应用。这是联想核心竞争力所在,联想可以和客户一起针对特定类型的应用进行量身定制。在这方面,联想与英特尔展开了众多合作。比如联想的Neptune液冷系统与第二代英特尔至强可扩展平台相结合、联想的LiCO HPC/AI软件堆栈与英特尔oneAPI编程框架保持同步等。
Trish也表示,英特尔与联想一起为客户交付解决方案,满足客户的多样化需求。英特尔和联想还计划携手创建面向高性能计算和人工智能融合的全新生态系统,包括在世界各地建立联合“高性能计算与人工智能卓越中心”,以进一步支持科研机构和高校开发解决方案。
英特尔与浪潮也进行了深入的合作。浪潮AI与HPC副总经理赵帅表示,在2011年的时候,浪潮与英特尔就共同成立了联合创新实验室,面向中国百亿次超算,从系统架构、处理器技术、软件调优等各个方面开展了深入的研究。这些年,双方在AI技术方面又有了一些新的进展。特别是第二代至强可扩展处理器加入了很多AI加速特性,浪潮也基于此取得了非常好的案例。
浪潮AI与HPC副总经理赵帅
当前,浪潮从计算平台、管理套件、框架优化、应用加速等四个层次致力于打造敏捷、高效、优化的AI基础设施。在ISC19上,浪潮联手英特尔发布了AI HPC融合一体机,其集成了最新的计算技术与优化软件,可通过容器化部署的软件堆栈和灵活的节点设计,高效支持AI和HPC的不同工作负载运行在同一个计算平台上,加速AI HPC研发与应用创新。
赵帅表示,超算中心的工作负载不一定百分之百都是HPC,还包含AI,未来的超级计算中心一定是HPC与AI相融合的一套超级计算机所支持的,AI和HPC融合的趋势会越来越快。浪潮AI现在发力比较快,主要的原因是CSP对AI建设的需求是比较迫切的。以前对于科学计算的需求比较大,现在AI迅猛发展,AI产业化转向产业AI化,更多拥抱AI,这些都决定了中国的教育、科研和企业对AI的需求都会越来越大,AI和HPC的融合是一个必然的趋势。
Trish说,人工智能的一些应用完全可以利用HPC的基础设施,比如医疗行业的基因测序是采用HPC,而精准医疗是比较典型HPC和AI融合的方式。HPC和AI的融合正是因为大家用同样的计算节点,同样的网络,同样的存储,同样的调度系统,其实这从本质上而言就是一套系统。特别是第二代英特尔至强可扩展平台加入了很多深度学习加速特性,从而让HPC与AI融合更加水到渠成。“从英特尔本身的角度来说,我们希望与合作伙伴在产业合作中走得更远,因为HPC和AI融合可以产生很多创新成果。”
科学计算的深入应用,深度学习驱动的人工智能,正在重新定义创新和应用边界。通过产品组合和生态建设,英特尔推动HPC和AI的融合,让更多的客户可以更高效、更高性价比地利用基础设施,驱动产业的发展。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。