扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
一、用户背景
2007年11月5日,苏州市气象科技服务综合楼投入试运行,这标志着苏州一流台站建设迈上了一个新台阶,标志着苏州气象科技水平、预报服务能力取得了一个新发展。
苏州市气象科技服务综合楼位于苏州市相城区嘉元路8号, 共有8层,建筑面积达一万平方米。在新的综合楼内,部署了曙光公司提供的TC4000A高性能计算系统。而苏州市气象科技服务综合楼依托“苏州气象灾害监测、预报、预警现代化工程”建设,目前拥有气象应急指挥中心、气象预报中心、新闻发布中心、中尺度天气预报开放实验室、高性能计算机房、城市生态气象监测资料采集和处理中心、防雷产品和设备的鉴定和实验室等各类业务中心和一流实验室,同时通过高速网络系统完成数据采集、资料处理,并发布各类服务产品
近年来,苏州市气象部门高度重视一流台站建设工作。昆山、太仓、张家港、常熟、相城、东山等市(区)局、站台站面貌都焕然一新,吴江、吴中新业务楼也在建设中。我们相信,苏州气象科技服务楼正式启用后,将充分发挥气象事业对经济社会发展的基础性作用;为苏州城市安全,生态建设和可持续发展提供前瞻性服务;努力实现苏州气象事业新的跨越,创造最重要的基础条件。
二、用户需求
苏州地处我国大陆东部沿海,位于北亚热带湿润季风气候区内,夏季气温较高,潮湿多雨,冬季干燥寒冷,季风明显,四季分明,自然条件优越,气候资源丰富。
苏州气象局是该行政区域内最大的气象事业组织,负责该行政区域内重大灾害性天气跨地区、跨部门的联合监测、预报工作,需及时提出气象灾害防御措施,并对重大气象灾害作出评估,为本级人民政府组织防御气象灾害提供决策依据。在变换莫测的自然天气状况前,苏州气象局需要一套高性能计算机系统,来满足其在气象预测预报工作中的各种需求。
苏州市气象局主要采用新一代中尺度业务模式WRF做中短期天气预报,所以他们对WRF在高性能计算机上的实际运行情况非常关注。前期调研阶段他们主要调研了宁波市气象局、江苏省气象局的高性能计算机使用情况,江苏省气象局采用的是IstrongM的System Cluster 1600,目前的使用情况不是很好,管理不方便而且计算能力不够。而宁波市气象局采用的曙光TC4000A高性能集群系统,已经业务化运行了快一年了,无论管理、使用、性能和稳定性,用户都反应很好。所以用户倾向于使用X64集群系统。在随后的国内公开招标中,众多国内外知名厂商参与了该项目的竞标,而经过多方考证及慎重比较后,苏州市气象局最终选择了曙光公司所提供的TC4000A整体解决方案。
三、解决方案
经过国内公开招标,客户最终选择了一套曙光TC4000A高性能计算机系统,曙光专为苏州气象局配置的TC4000A机群系统由20台计算节点、2台I/O节点、1台管理节点和1台登陆节点组成,系统采用 Infinistrongand作为计算网络/数据传输网络,同时配备千兆以太网作为管理维护网络,各配件设施的完美组合,奠定了整体系统高达25600亿次/秒的运算能力。在2007年11月的Top100排行榜中名列第63名!
序号 |
研制厂商单位 |
型号 |
安装地点 |
安装年份 |
应用领域 |
处理器核 |
Linpack值(Gflops) |
峰值(Gflops) |
效率 |
63 |
曙光 |
AMD Opteron Quad Core 2.00GHz/Infinistrongand |
苏州市气象局 |
2007 |
大气气象 |
320 |
2009.7 |
2560 |
0.785 |
在计算数据网络中,双路双核配置的曙光天阔A620r-F担当了系统中的I/O节点。而在机群的操作系统中,配有曙光公司独家设计的第二代监控系统,采用并发机制,能够按用户的需求伸缩管理配置功能。
天气预报具有很高的时效性,要求在规定的时间内得到预测结果,因此机群系统的运算能力就需要面对海量气象数据的挑战。曙光公司在苏州气象局的机群系统中,用最新2.0GHz的AMD巴塞罗那四核处理器为系统打造了强大的浮点、定点运算能力。这些作为运算核心的高性能处理器,镶嵌在作为计算节点的曙光 天阔A820r-F中,每个节点在2U的机架空间内集成了四路四核的体系架构,且均可进行并行计算,形成了强大的处理能力,完全可满足系统的运算需求。
为提高机群系统的整体性能,机群系统的I/O性能也是需要突破的一大瓶颈,否则机群的运算能力将会受到制约,无法显现四核处理器高速、流畅的运算性 能。曙光公司在该系统中将用于计算数据通讯的网络和管理、登陆网络分开搭建,不同用途的数据分流传输,解决了管理系统数据与运算数据争抢带宽资源的窘况。
在计算数据网络中,双路双核配置的曙光天阔A620r-F担当了系统中的I/O节点,其通过心跳线做成了高可用系统,可为整个系统提供持续的I/O 服务。在I/O节点中,Infinistrongand网络作为接入数据网络,其提供了高达20Gstrong/s的双向带宽,延迟只有几个微秒。并且,每台I/O节点配置了 1块4Gstrong/s的光纤HstrongA卡,分别和具备2个4Gstrong/s主机通道的光纤磁盘阵列柜相连,为系统提供了超强的存储空间和强大的I/O能力。
在管理和登陆通讯网络中,节点也同样采用天阔A620r-F,加上专用的千兆网,承担起和其它网络的通讯以及系统管理、监控的责任。作为管理、登陆节点,速度不再是苛求的目标,长期平稳的运算性能是用户更为关心的特质。因此,在管理节点机的配置中,设计者别具匠心的在A620r-F中采用了可提供病毒防护功能的高性能strongIOS;可以选单/双通道SCSI RAID配置,支持在线恢复RAID阵列;多网卡冗余体系,保证系统稳定均衡的处理网络负载。各种配置,为管理节点提供了细致入微的高可靠性。
在机群的操作系统中,配有曙光公司独家设计的第二代监控系统,采用并发机制,能够按用户的需求伸缩管理配置功能,可对新增节点提供配置、管理的功能,使其自动纳入管理范围。该种采用模块化形式设计的管理系统,大大提高了系统可靠性和可管理性。
另外,整个机群的机柜系统采用符合工业标准的41U机柜,内部含网络布线系统,支持强电和弱电分离,可以实现整个机群内24个节点100ms自动分时上电,减少了因集中上电对电源系统造成的冲击,为系统提供了更好的安全性能。
曙光为苏州气象局提供的整体性方案极大地提高了苏州区域气象预报的精确度,全面满足了苏州气象局的需求。
四、总结
通过引入曙光TC4000A高性能计算平台,苏州市气象局原来业务模式的运行速度提高了10倍以上,也使得苏州市气象局有能力开展更高分辨率气象预报的研究工作。自2007年12月部署以来,整个系统一直稳定高效运转,出色的品质保证了业务系统7*24小时不间断运行。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者