扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
进入二十一世纪,集群系统已成为高性能计算机系统的主流体系结构之一,性价比高、兼容性强、可靠性高、可维护性好、应用领域广等特点让它成为用户的理想选择。集群系统采用了商品化部件,通过高速标准化网络实现结点间互连,对外提供单一的系统映像,支持大规模科学工程计算、信息服务、事务处理等,能为用户提供百亿次到万亿次的计算能力。而科研领域一直是集群技术,特别是并行计算技术应用最为广泛的领域。近日,曙光公司为浙江师范大学量身打造了一套凝聚态物理高性能计算平台,曙光4000A再次成为科研计算的排头兵。
新科技呼唤高性能
凝聚态物理是物理学的一个分支,主要研究有序及非晶体固体的性质,也研究流体和气体的性质,以及复杂系统如聚合物和固体及超分子聚合体的性质。浙江师范大学凝聚态物理研究所是浙江师范大学重点研究所,目前承担国家自然基金项目一项,省自然科学基金青年科技人才培养项目一项,省部级自然基金项目和科技项目7项,如此多的项目没有高性能计算平台为依托研究起来谈何容易。尤其是在渗流力学的研究中,由于渗流的计算模拟要求最大限度地逼近实际的地质条件和地层参数及渗流中的物理化学过程和全部生产实际,没有高性能计算机的支撑几乎是不可能完成的。
高性能带来新突破
曙光公司在对浙江师范大学凝聚态物理研究所的应用经过仔细分析后,提出了曙光4000A集群系统解决方案。系统由计算系统、网络系统、机群管理系统、存储系统等组成,计算系统包含16个4路计算节点和62个2路计算节点,计算节点全部采用最新的AMD64位巴塞罗那四核芯片,总运算能力超过5万亿次/秒。作为本套系统的IO节点,6台曙光天阔A620r-FX部门级服务器提供了强大的信息交换能力,再加上曙光DS6312FE、曙光JB6312EE两款新型磁盘存储阵列的使用,确保了整套系统实现了高性能、高可靠性、高扩展能力、高可管理性。
高性能
节点服务器采用曙光天阔A820r-F(2U,16台)和A610r-FX(1U,62台),采用AMD Opteron 8354及AMD Opteron 2354四核64位处理器,提供强大的运算能力(5万亿次/秒)。
所有计算节点和I/O管理节点配置的网卡均支持I/O加速功能,可以有效提升系统性能,降低网络传输对CPU的占用率;
高可靠性
集群专用存储阵列柜设计,配置48块300GB 15Krpm 4Gb接口磁盘,做为整个集群的数据存储使用,集群计算节点与存储系统采用4GB光纤通道连接,具有很高数据读写、存取性能;同时具有72小时锂电池不间断数据保护。
双网共存设计,设计两套千兆网络,一套用于集群计算(H3C-S5100-48P-EI),另一套用于I/O及集群管理,同时两套网络相互备援,在其中一套网络出现异常时另一网络可动态切换使用。
I/O管理节点对集群提供DCOS(集群管理)、DCJM(作业调度)、NFS(文件服务)和SEP(系统登录点)4个功能。
高扩展能力
曙光集群机柜和交换机均支持堆叠扩展,当需要增加计算节点时,只需要增加相同型号的机柜和交换机堆叠,就可以为增加节点提供更多的空间和端口,同时也不影响整体计算性能,这样保证了当前的投资,而且保证了系统的完整性;
曙光SKVM视频切换系统可以在线管理86个节点;
曙光集群管理软件(DCOS)和集群作业调度软件(DCJM)软件可以无缝扩展,无须另外购买软件许可即可将扩容的节点机纳入当前的系统中进行管理、调度。
高可管理性
视频切换采用曙光SKVM,SKVM专为集群系统设计使用,通过普通网线级连所有节点,采用SKVM可以实现远程操作,最大连接距离可以达到150米;
SKVM采用普通网线连接,连接简洁、美观,管理方便;
曙光DCOS、DCJM将新集群与老集群有效的整合管理和调度,同时DCOS和DCJM均支持基于WEB的管理方式,使得集群管理更加方便。
高性能计算在高校科研领域的应用中一般会遇到两个突出的问题,一是高性能带来了高要求,使用者为某一学术领域的权威人物,但不一定是高性能计算方面的专家,对这个“庞然大物”的使用管理有一定困难;二是高性能带来了高投入,然而客户希望节约科研经费,支持更多的科研项目进行。以曙光4000A为基础的这套凝聚态物理高性能计算平台很好的解决了这两个问题,真正的把高性能计算机做成了人人可驾驭的科技工具,最大程度上节约了部署费用。这套系统将辅助浙江师范大学攻克一个个科学难关,成为科研领域不可或缺的“助推器”。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者