至顶网计算频道 11月14日 新闻消息(文/李祥敬):近日,以“智能时代·算力赋能”为主题的首届中国超级算力大会在北京召开,此次大会由中国大数据与智能计算产业联盟、ACM SIGHPC China共同主办。本次大会汇集了国内外院士、知名学者和产业大咖,围绕高性能计算技术的研究成果、人工智能的进一步发展,应用创新等主题,探讨行业发展趋势与应用实践经验,促进产、学、研各界的深度合作,推动中国高性能计算技术与应用的发展。
随着计算智能时代的发展,大数据、超级云计算和深度学习算法的融合创新,已然成为计算智能时代发展的三驾马车。数据与计算不仅在各个领域研究发挥着重要作用,同时也将对各行各业的数字化转型的发展起到不可或缺的推动作用。
Mellanox市场部高级副总裁Gilad Shainer表示,不管是高性能计算还是人工智能都是一个系统工程,不存在单一的技术瓶颈。现在不管是处理器还是存储、网络等都处于变革期,这为HPC和AI的发展创造了有利的条件。
Mellanox网络以技术创新为驱动,赋能全球最快的前10台的超级计算机之6台, 包括美国最快、中国最快和日本最快超级计算机。Mellanox HDR InfiniBand网络已被广泛使用与世界各国的多台超级计算机中,包括微软Azure公有云的HPC云中。
InfiniBand是一种基于开放标准的互连技术,可在保持向后和向前软件兼容性的同时,不断开发新的功能。InfiniBand是全球领先的超级计算机的首选互连技术,取代了性能较低或专用的互连方案。“我们的HDR InfiniBand解决方案为全球的超级计算机提供高速连接,增强了科学研究与发现的速度,并推进了百亿亿级 (Exascale) 超级计算的计划。”Gilad说。
Gilad说,以数据为中心是网络计算的核心,网络计算包括了从互连、网络、通信和应用的各层面,发展前景广阔。Mellanox是唯一一家提供200Gb/s端到端网络的公司,所有200G产品都支持网络计算技术。“连接技术非常重要,不管是PCIE 4.0还是InfiniBand,以及CXL等连接协议加速了数据的流动。”
Mellanox HDR 200G InfiniBand解决方案包括ConnectX-6网卡、Mellanox Quantum交换机、LinkX线缆和光模块,以及软件包。凭借其最高的数据吞吐量、极低的延迟和智能的网络计算加速引擎,HDR InfiniBand可为要求最苛刻的计算和数据应用提供世界领先的性能和可扩展性。
更智能和快速内部连接对于未来高性能计算和人工智能的发展起到了至关重要的作用,而Mellanox网络计算技术成为解决目前HPC和AI超级计算机的性能和扩展性的关键技术。Mellanox智能网卡将Mellanox网络的应该扩展到了更广阔的领域,可以实现计算机中的计算机。
比如最新的Mellanox ConnectX-6 Dx和BlueField-2是新一代云SmartNIC和I/O处理单元(IPU)解决方案,在Mellanox高性能云网络基础之上,ConnectX-6 Dx和BlueField-2在关键应用中引入了硬件加速引擎和卓越的软件编程能力。不仅可提升超大规模数据中心、企业和电信环境的安全性和效率,还能使实现高投资回报率(ROI)。
ConnectX-6 Dx SmartNIC可提供两个25、50或100Gb/s端口或者单个200Gb/s端口,其以太网卡使用了50Gb/s的PAM4 SerDes技术和通过PCIe 4.0连接到主机。ConnectX-6 Dx创新的硬件卸载引擎,可支持IPsec和在线TLS动态数据加密、先进的网络虚拟化、RDMA over Converged Ethernet(RoCE)和NVMe over Fabrics(NVMe-oF)存储加速等。
而BlueField-2 IPU在一个System-on-Chip(SoC)上, 集成了ConnectX-6 Dx的所有高级功能,Arm处理器阵列、高性能内存接口及各种灵活处理功能,支持高达200Gb/s的以太网和InfiniBand接口。基于BlueField-2的嵌入式控制器是构建经济高效的闪存、安全、物联网和边缘计算平台的理想之选。BlueField-2 SmartNIC可充当协处理器,相当于在计算机中内嵌另一台计算机,运用先进的软件定义网络技术、NVMe SNAP存储解聚技术和增强型安全功能可实现裸金属环境和虚拟化环境的转换。此外,BlueField-2可在云上或网络边缘运行AI应用时实现无与伦比的性能和效率。
Gilad表示,基于EDR和HDR InfiniBand的Mellanox LongReach远距离连接方案和Skyway InfiniBand/以太网网关即将面世。新型的网络拓扑为解决未来E级机扩展问题提供了新的思路,Mellanox网络计算技术已经在网络利用率、系统性能、系统健壮性上显现了出色的性能。InfiniBand 400G NDR产品将会在2020年面世,800G XDR产品将在随后的2年内面世。“更多的网络计算技术将会被集成到新产品中。”
在首届中国超级算力大会上,致力于高性能计算(HPC)和人工智能(AI)技术研究、教育和推广的国际HPC-AI咨询委员会(HPC-AI Advisory Council),携手中国大数据与智能计算产业联盟在大会上举办了关于容器环境下的RDMA应用及优化研讨会。
HPC-AI咨询委员会是一家非盈利性国际组织,成立于 2008 年,拥有400多名成员,致力于HPC-AI技术的教育与推广。成员间共享专业知识,建立特殊兴趣小组,并通过技术中心宣传HPC和AI技术的优势与应用,探索未来发展方向。该咨询委员会主办了多次全球性年度会议和STEM挑战赛(包括中国的大学生RDMA编程竞赛和德国的大学生集群竞赛)。
作为国际高性能计算及人工智能咨询委员会(HPC-AI Advisory Council)主席,Gilad表示,目前全球数据量正在飞速增长,我们面临巨大的计算挑战,现有的CPU无法满足人们的计算需求。“当前,我们正在从以计算为中心切换到以数据为中心。数据中心架构从以CPU为核心到以数据为中心,网络计算成为突破口。而RDMA技术受到了互联网以及云计算提供商的青睐,成为云服务确保高性能的保障。目前RDMA不仅仅限于数据中心内部,已被扩展到从云端到边缘。”
同时,2019亚太区大学生RDMA编程挑战赛颁奖典礼也盛大举行。做为高性能计算领域领先的研究和教育组织,国际HPC-AI咨询委员会面向亚太区大学生发起了第七届RDMA编程挑战赛(The 7th Student RDMA Programming Competition),旨在为在校大学生及已经毕业的学生提供学习RDMA,并成为RDMA编程高手的绝佳机会。
当前,RDMA技术正在成为以数据为中心的计算模型的关键。无论是传统的高性能计算应用还是新兴的深度学习框架,RDMA通信方式都是其中的关键环节。随着RDMA技术的应用范围不断扩大,国内外顶尖企业越发重视这一技术所能创造的价值,对该领域人才的需求也愈发增加,这也正是大赛的意义,为企业挖掘最优秀的RDMA技术人才,同时激发应用的最佳性能。
自2013年首次举办,每届大赛都吸引了来自全国各地的20家以上的高校报名参加。在2018年举办第六届大赛时,更是吸引了50余所高校报名参加。经过六年的发展,大学生RDMA编程挑战赛现已成为培养和选拔高校顶尖技术人才,推动RDMA技术在HPC和AI领域应用的重要平台。
通过参加竞赛,学生们能够深入接触HPC和AI领域最前沿的技术和工具,锻炼以技术实践解决热点应用问题的综合能力。因为注重技术创新及与行业结合,通过比赛培养了许多RDMA技术领域的专业人才,并通过学校输送给国内外各大企业及研究机构。
Gilad表示,在过去的RDMA竞赛中,参赛队伍对Spark在RDMA上进行了优化,以及在Tensorflow、 MXNet等AI框架用RDMA进行了优化。本次比赛的题目是“如何使用RDMA技术优化在容器环境下的HPC应用”。
具体的参赛要求:参赛队伍需要解释选择Dockers或Singularity的理由;参赛队伍可从HPC-AI咨询委员会的网站上任选两个基于RDMA技术的HPC应用或是自有的应用进行开发;在基于容器的环境下演示你所选择的RDMA应用程序可以成功运行;比较在基于容器和非容器的环境中,基础性能(如使用基于MPI的性能测试工具或使用其他底层性能工具)差异和所选应用的性能差异;在基于容器的环境中,运用RDMA技术将应用性能进行调优,最终得到最佳性能。
从以上要求可以看到,本界竞赛旨在通过优化各种RDMA应用在容器环境中的性能,切实解决业界面临的问题。通过这次竞赛,证明了在容器化的环境中同样可以得到物理机下的性能。最终中国科学技术大学成为2019亚太区大学生RDMA编程挑战赛冠军团队。
Gilad说,大赛的每次选题都是精心设计的,具备前瞻性。比如前几届大会的很多比赛成果已经进入到商业应用中。“这次比赛的容器技术与RDMA的结合也是如此,毕竟容器技术创新了应用交付,而RDMA提升了应用性能。两者结合其实打通了技术人员与业务人员的藩篱,让技术与应用紧密融合。”
容器技术是现在的热门技术,而对于HPC和AI应用而言,容器简化并加速了构建和隔离应用程序的过程;容器是轻量级的,而且日常管理开支较低;容器能够更加容易地实现应用程序共享和再现性,因为容器映像包括应用程序及其开发环境。特别是对于AI应用,每个AI框架都有许多依赖项。每个依赖库都有特殊的版本需求,所有AI框架都经常发生变化。容器化有助于开发人员克服这些挑战。所有东西都打包成一个单独的包,包括所有必需的部件。
中国科学技术大学获奖学生张子豫接受笔者采访时表示,容器技术对于HPC应用而言是一种创新性的交付形式,非常易于扩展,而且对于性能影响有限。他们所在小组测试了基于Singularity的主流深度学习框架比如Tensorflow,发现性能影响不大,最终他们选择了Apache Storm流式大数据处理框架,结合RDMA技术在容器环境进行应用。
张子豫还说,中国科学技术大学每年都会参加大赛,在RDMA方面积累了比较多的经验。而且他们并不只是做简单的调优工作,而是以应用为出发。比如他们计划将Apache Storm、Apache Kafka、NoSQL数据库等打包开发相应的应用。
对于获奖,张子豫表示,大会对于参赛评分比较全面,比如成功运行应用、应用的调优,还有答辩,以及其他创新工作,从多个维度考核参赛队伍的能力。“非常感谢国际HPC-AI咨询委员会提供了这样一个可以与其他院校交流的平台,通过交流,我们的能力也得到了提升,收获巨大!”
好文章,需要你的鼓励
AMD CIO的职能角色早已超越典型的CIO职务,他积极支持内部产品开发,一切交付其他部门的方案都要先经过他的体验和评判。
医学生在选择专业时,应当考虑到AI将如何改变医生的岗位形态(以及获得的薪酬待遇)。再结合专业培训所对应的大量时间投入和跨专业的高门槛,这一点就更显得至关重要。
我们拥有大量数据,有很多事情要做,然后出现了一种有趣的技术——生成式AI,给他们所有人带来的影响。这种影响是巨大的,我们在这个领域正在做着惊人的工作。