扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
室研究课题的一个显著特点是多学科交叉、理论与计算实践相结合。其研究领域不仅涉及到非线性泛函分析及非线性偏微分方程理论、微分动力系统等数学计算的内容,也涉及到计算机软件理论基础等信息科学的内容,同时还包括数学与信息科学相结合的理论与计算研究。
由于该平台所承担工作的特殊性,决定了其对高性能计算产品的性能要求极为苛刻,不仅需要能够承载海量数据、信息处理所产生的惊人的运算量;而且由于在高速运算过程中,系统中CPU之间的通讯量极大,相应地要求整个系统需要具备高性能的通讯网络;除此之外,由于学校用于科研项目采购的经费有限,同时也不可能配备专门的技术人员进行系统的日常管理,因此对于如此大规模的系统,不仅要严格控制其总体拥有成本,更要求系统具有很高的可管理性。
针对北京航空航天大学教学科研项目的实际需求,曙光工程师采用配置巴塞罗那四核处理器的曙光TC2600刀片服务器来搭建系统平台。整个系统平台包含64个计算节点、2个存储节点和1个管理登陆节点,64个计算节点全部采用曙光TC2600刀片服务器,配置128颗1.9GHz巴塞罗那四核处理器,可为用户提供多达512个并行计算单元;计算网和管理网双网分离的设计模式,保证了系统数据和信息的快速传输。同时,通过各种成熟设备的合理配置,融入曙光TC4000A的成熟应用,为北航打造了高性能、高可管理、高性价比且具有良好可扩展性的教学科研运行平台。
北航高性能集群系统连接图
TC2600刀片服务器: 引领“高性能”走向“高效能”
目前,计算机群已经成为教育科研领域高性能计算的主流体系结构,机群技术推动着高性能计算不断向前发展。但是超级计算机群由于规模不断扩大所导致的系统瓶颈越来越多,迫使服务器厂商不断探索新的系统集成方案为用户提供更科学合理的应用。
在北航高性能计算平台解决方案中,曙光工程师选择利用曙光TC2600刀片服务器来搭建该系统平台的计算节点。曙光TC2600是真正高稳定、高可用、高密度、高扩展的新一代高效能服务器产品,其采用整体优化的设计策略,具有更好的计算密度、更多的集成功能,64个计算节点可为该教学科研平台提供强大的浮点运算能力,完全满足该校科研工作海量数据处理的需求。
在TC2600搭建的系统平台中,曙光工程师为每个计算节点配置了两颗AMD新近推出的巴塞罗那四核处理器,曙光公司技术人员认为“巴塞罗那”所具有的技术优势非常适合用于构建大规模机群系统。与双核处理器相比,“巴塞罗那”四核处理器不但增加了CPU core的数量,还将K8架构的SSE指令执行带宽由原来的64位加宽至128位,取指带宽由每周期的16字节提高到32字节,使得浮点运算能力相比双核服务器得到大幅度提高。同时,由于AMD四核可以共享L3缓存,数据的复制不需要借助前端总线,可以直接在处理器内部以处理器频率完成,与将两个双核芯片集成在一枚管芯上的设计方式相比,数据处理能力也得到大幅度提高。并且,“巴塞罗那”还改进了内存控制器,相比双核处理器具备更高的内存访问速度。
除了使系统具备更高的计算密度,TC2600刀片服务器和巴塞罗那四核处理器另一大突出特点是节能。TC2600刀片服务器采用了先进的多渠道节能技术,通过对服务器功率部分进行设计和更改计算刀片操作系统内核两种方式,大大降低了系统功耗;巴塞罗那四核处理器则在节能方面采用了更精细的内部设计,其拥有业界首次使用的双重动态电源管理技术,能对CPU和内存控制器分别独立供电,有效降低了处理器的功耗。曙光TC2600刀片服务器和巴塞罗那四核处理器的结合使用,使得系统的整体能耗有了大幅度的降低,建成后的整个系统总功耗不超过17KW,每年可为国家节约能源43800千瓦时,真正做到了由“高性能”向“高效能”的转变。
TC4000A整体解决方案:高效能的强力“组合拳”
尽管高效能的曙光TC2600刀片服务器和巴塞罗那四核处理器已经具备不可比拟的技术优势,但是成熟可靠的整体解决方案是其良好性能得到充分发挥的根本。在本项目中,曙光成熟的TC4000A整体解决方案也是其成功赢得用户青睐的一个重要原因。曙光为北京航空航天大学打造的教学科研平台系统整体解决方案,通过将一系列高性能硬件设备进行合理配置,不仅保证了系统具有高效能,而且使系统具有极高的稳定性、可靠性和良好的可扩展性,全方位保证系统具有更高的性价比。
针对该项目中的海量数据和信息,曙光工程师采用了曙光天阔A620r-F服务器作为该系统的IO和存储节点,通过HBA卡连接光纤存储设备,能够为系统提供大容量的高速存储,用以保存关键数据;存储系统则采用曙光DS2412FA磁盘阵列,其具有双冗余热插拔Raid控制器提高系统可靠性, 3TB的存储空间完全满足北航大规模计算的存储需求,不仅如此,该磁盘阵列具有足够的存储扩展空间,单柜内可扩展到高达18TB的存储空间,具有极高的性价比。
为了解决机群系统中普遍存在的计算网络带宽和存储网络带宽两个IO瓶颈,曙光工程师为该系统配置了计算网和管理网两套网络。计算网采用性价比最高的千兆网,可以实现全线速无阻塞数据交换,提高并行计算效率;管理网则利用一台千兆交换机配合刀片机箱内的千兆网络交换模块组成,计算网和管理网双网分离、专网专用、互为备份,大大提高了整个机群系统的可用性和稳定性,同时又充分保证系统信息、计算数据的传输带宽和延迟,保证信息和数据能够快速传输。
此外,为了保证系统具有更高的可管理性,该平台的所有硬件都被部署在曙光拥有自主知识产权的TC4000A机柜中,其在功能上更注重实用性,具有多层次的LCD显示和查询功;全方位的管理和监控,可以对系统内的任何节点的配置和部署进行实时监控;同时其还拥有详尽的使用文档和帮助系统、简洁的操作界面等,为师生的应用管理提供了极大的方便。
结束语
曙光与北京航空航天大学在高性能计算领域已经进行过多项合作,北航自动化学院、理学院、航空学院等多个院所都已成功部署曙光天潮系列机群产品,为北航的教学科研工作增添了强劲动力。在此之前,尽管曙光TC4000A超级计算机机群已经是一款成熟应用的产品,其高稳定性和可靠性已经得到了实际应用的证实。但是,本次配置巴塞罗那四核处理器和TC2600刀片服务器的曙光TC4000A在北京航空航天大学的首次应用,充分显示了用户对于曙光产品和其整体解决方案的高度认可,同时也展示了曙光对于解决方案的成熟应用和对于产品市场的良好掌控能力。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者