扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
近日,在国家理论化学计算重点实验室吉林大学理化所的高性能计算集群设备招标中,曙光公司再次力压群雄一举夺标。吉林大学理化所是理论化学计算国家重点实验室,1989年在唐敖庆院士建议下国家计委批准在吉林大学建立理论化学计算国家重点实验室,也是我国唯一从事理论化学基础研究的国家重点实验室。针对吉林大学理化所的高性能机群主要面向整个理化所提供高性能服务的要求,曙光公司的技术方案采用了基于上海超级计算中心曙光4000A/5000A(这两套系统分别在2004年和2008年获得全球超级计算机排名前十,也是中国高性能计算机的最好成绩)的设计、实施及运营的成功经验,其设计原则是:高性价比、高稳定性、面向多种应用计算类型。而从实际应用角度来讲,无论是计算能力、管理能力还是以后的扩展能力都达到了非常高了水平,得到了客户的高度评价。
首先是计算能力,整个系统的计算节点采用业界先进的曙光天阔服务器I620r-F,配置Intel Xeon 64位处理器的架构,具有8个处理内核(2.66GHz,12M L2 Cache),16G DDR2 667MHz内存,2块146G 15Krpm SAS硬盘。整个高性能计算机的双路计算模块为128个,可以提供强大的浮点运算能力和定点运算能力(10.895万亿次),完全可以满足系统运算能力的需要;双路节点主要是满足常规计算的计算池,实验室的常规计算需求可以在该部分完成。作为一个综合性的适于多种应用的计算中心,曙光在方案中建议有2台8路和2台四路节点作为不同应用和性能的SMP节点,这样可以扩大整个系统的适于范围;可以适于与某些特殊需求或者极端条件下的算例的计算,例如超大规模体系和高精度计算。计算网络、存储网络都采用千兆以太网,提供全线速连接;而管理网络也采用千兆网络,满足管理软件的带外管理的需求,同时也提供计算网络的备份。
在管理能力方面,整个系统完全符合SUMA标准,即具有可扩展性(Scalability)、可用性(Usability)、可管理性(Manageability)和可靠性(Availability)四个方面的特性。机群管理系统尽量采用并发机制,并且能够对新增节点提供配置、管理的功能,使其满足机群内节点的基本配置条件,自动纳入管理范围。曙光机群管理系统软件(Gridview)是为国内首台百万亿次的曙光5000超级计算机开发研制的,可以对超过2000个节点的超大规模机群进行web方式的带外管理和部署。它是一套多功能、易使用、可扩展的实用化机群管理工具,支持异地管理,异构机群统一管理和报表功能。系统管理功能采用模块化形式,能够按用户的需求伸缩管理配置功能。曙光作业调度系统支持Web界面提交、作业记账和统计功能等功能,在可以区分串行作业及并行作业的不同需求,支持用户作业数和作业规模限制。支持多种调度队列和调度策略配置,能够满足大规模机群的应用。我们同时也提供TORQUE/PBS作业调度系统,可以满足标书所有要求,同时可以限制用户不能在节点上登录,以及X-windows界面的监控管理界面。
另外值得一提的还有这套系统的扩展能力,当任务量增加,需要增加计算单元时,只需要简单扩充增加计算节点即可,这样保证了整体架构保持不变,保护了用户当前的投资,而且保证了系统的完整性;机群群操作系统和机群系统软件可以无缝扩展,无须另外购买即可将扩容的节点机纳入当前的系统中进行管理、调度;而且同时支持异地异构机群及带外管理。为客户带来了极大的方便。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者