计算多元化时代 中科曙光用EasyOP护航先进计算 原创

在近日举行的第13届全国高性能计算学术年会(HPCChina2017)上,中科曙光副总裁任京暘分享了其对计算多元化和先进计算的认识。

至顶网服务器频道 11月08日 新闻消息(文/李祥敬):现今这个时代,计算这个词的内涵和外延不断被扩大,比如高性能计算、云计算、量子计算、类脑计算、边缘计算等等。之所以会有这么多计算类型,肯定是需求驱动的。在近日举行的第13届全国高性能计算学术年会(HPC China2017)上,中科曙光副总裁任京暘分享了其对计算多元化和先进计算的认识。

计算多元化时代 中科曙光用EasyOP护航先进计算

同时,曙光与中国科学技术大学就建立“EasyOP高性能计算在线服务平台(安徽分中心)”(下简称“安徽分中心”)举行授牌仪式。应该说,安徽分中心的建立是曙光是先进计算多元时代来临之际,服务专业化的探索与具体实践。

计算多元化时代的来临

作为一年一度的高性能计算年度盛会,HPC China2017为我们呈现了未来HPC的趋势。虽然这次大会主要是谈到高性能计算,但是不容忽视的是我们已经步入到计算多元化的时代。

任京暘表示,以前我们或许可以依靠单一的计算形态来包打天下,在当今这个时代,显然这已无法满足人们的计算需求。高性能计算已经成为新常态,计算的融合趋势也非常明显,比如高性能计算、云计算的“你中有我,我中有你”。

在这个计算多元化的时代,企业需要关注哪种计算形态更加适合自己的业务应用创新。对应,企业IT基础设施也需要进行调整,来适应计算的多元化趋势。现在人工智能计算非常流行,机器学习与深度学习形态不断涌现,CPU与GPU,甚至FPGA等异构计算成为标配。

言而总之,虽然我们面临很多新的计算形态,但是用先进计算可以解决相应的痛点。

何为先进计算?

先进计算出现在《“十三五”国家科技创新规划》中,重点发展比如云计算、量子计算、异构计算、智能计算等,所以,先进计算是多种计算方式的统称。

从高性能计算起家的曙光在进入到计算多元化时代,也在用自身行动去践行先进计算。2014年的12月,中国科学院成立了中科院先进计算技术创新与产业化联盟,曙光就是成员。

“曙光公司是中科院先进计算技术创新与产业化联盟理事长单位,这使得曙光不仅拥有计算领域长期的技术和产业化积累,还能够在最前沿的计算技术面前‘近水楼台先得月’,探索各类创新性、颠覆性先进计算手段。”任京暘说。

曙光在系统的可靠性和容错性、应用效率与适用性、性能与可扩展性、高效管理和运维、生态环境与产业化以及功耗、能效比、节能方面进行技术创新,在绿色节能、信息安全、网络安全、技术应用(包括智慧城市、物联网、生物识别、卫星遥感等)方面进行全产业链布局,不断实践探索,抢滩先进计算领域。

具体来说,中科曙光会在三个方面进行先进计算的布局。第一,优化升级,也就是对主流计算形态比如高性能计算、云计算等进行优化升级;第二,在先进计算这个大的范畴之下,更加注重与应用的融合。现在很多应用在倒逼计算能力如何与其结合更加紧密;第三,跟踪在先进计算领域的颠覆性和突破性的技术,比如量子计算和类脑计算等。

“曙光致力于在现在这样一个先进计算的时代能够推动多元计算的发展以及多元计算的融合,所以我们自身围绕着先进计算里面的不同领域也做了一些工作。比如高性能计算领域的地球数值模拟装置、中国首台量产全浸没式液冷服务器、全球首款量子通信云安全一体机等。”任京暘说,“曙光在先进计算领域多元化发展,与合作伙伴一起在硬件、软件、服务等实现整体化的发展。”

EasyOP是先进计算的探索落地

任京暘表示,先进计算时代多元计算能力融合大的背景下,服务能力特别关键。如果说以前只是把计算设备卖出就完事了,现在则要求厂商提供更为完善的服务支持。这种服务不仅仅是售后服务,还包括运维等更高层级的服务水平。EasyOP就是这样的产品,其是提升高性能计算集群可用率和使用效率的先进管理工具,方便用户高性能计算基础设施的后期运维与管理。

曙光EasyOP产品总监首席运维架构师安磊告诉记者,曙光之所以推出这样的产品,主要是为了在软件方面发展成一个很好的生态环境,同时在高性能计算环境研发这一块促进计算服务业的发展。

“在高性能计算领域,我们最终是希望建立面向用户提供以应用为导向的计算框架设计。另外,计算平台一定是要富有弹性。这就要求我们不仅提供应用计算,还要把生产数据变成一个生产要素来更好地为HPC使用者提供服务。”安磊说。

据安磊介绍,曙光与中国科学技术大学在EasyOP上进行了积极探索,不光提供了运维服务,还有面向应用需求的深度优化服务。此外,曙光在无锡搭建了专门针对HPC安全分析的云数据中心,为用户提供硬件系统的运维、超算系统的巡检、应用软件调优和作业报表分析这四项功能,以期待能够达到一个线上、线下并举,远程、本地共存的这样一种运维多维度的服务尺度。

“通过上面的手段我们现在已经初步尝试了四种级别的运维服务,比如标准级、系统级、应用级跟业务级。最终我们希望能够达到两个目标,一个是可以根据需求灵活定制一个运维方案,第二个是提供不同层级的HPC专业运维服务。”安磊说。

目前目前EasyOP管理的节点已经超过了一万个以上,为750万个大小作业提供了各类支持服务,并且对所有接入集群的各个节点提供了超过180项的监控指标,这些指标包括硬件的、环境的、软件的、应用的等等,其中40%以上提供了针对应用特征的优化。目前为止EasyOP覆盖了7个领域,比如CAD、气象、海洋、物理、生物、高分子还有深度学习等。

安磊表示,最终EasyOP的目的是希望通过深度优化服务为用户带来应用特征的总结,用户的哪一类应用适用于哪一类计算,面对百家争鸣和百花齐放的时代,让用户能够更轻松准确地选择到自己最适用的计算类型。

“我们希望通过专业的运维平台和定制的托管服务还有专家深度支持,能够为用户提供一个HPC应用服务市场,最终形成以EasyOP为依托平台的交易生态的平台。比如说有些用户可以通过这个平台很方便地采购或者售出您手中的空闲资源,或者可以把您的科技成果或者计算模型做一个分享。最终EasyOP也从EasyOperation的角色变成EasyOnlineCaller的角色,希望能够通过这个平台更好地加速未来丰富多彩的计算服务时代的到来。”安磊说。

具体到安徽分中心,曙光公司HPC产品事业部总经理李斌表示,EasyOP关注的焦点是系统交付给用户之后怎么保障这个系统的运行效率。通过这样一个平台,我们可以非常及时地解决用户在使用过程中的各种问题,保证整个系统的良好状态。

“EasyOP将为安徽省打造国家综合性科学中心,推动安徽省产学研用一体化快速有效轮动发展,进一步升级中部地区科技服务水准。EasyOP安徽分中心的落成,不但能够为安徽省重大工程中高性能计算基础设施的后期运维与管理提供高效的工具,还将帮助中科大降低当前和未来集群使用过程中的运维压力,有力支持安徽省新支撑体系建设的战略。”李斌说。

中国科学技术大学计算机学院李京教授表示,随着云计算、大数据还有人工智能这些新技术的发展,现在高性能计算的内涵也发生了很大的变化。2003年的时候科大成立了国内高校第一个校级的高性能计算平台,起初这个平台主要是支持理科的计算,现在则是扩展到工科领域,这对整个平台的要求越来越高。另外就是科大很多中小高性能计算集群是跨区域分布,这给日常的运维工作提出了很大的挑战。

“通过引入EasyOP,解决了我们在人手和经验上的一些不足,实现了运维管理和应用优化。特别是EasyOP利用高性能计算平台的运行和生产数据,实现了用户的应用优化,提高了平台资源的利用率和应用运行效率。”李京说。

结语

EasyOP高性能在线服务平台是一种创新性服务新模式,是中科曙光探索先进计算落地的有益尝试。EasyOP安徽分中心的建立可以将EasyOP的经验进行复制,实现更广阔的区域覆盖。

来源:至顶网服务器频道

0赞

好文章,需要你的鼓励

2017

11/08

11:28

分享

点赞

邮件订阅
白皮书