扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
PHPC100是曙光公司研制的最新高性能计算机产品,符合现在高性能计算技术和市场发展的趋势,可以解决诸多限制性因素,为生物计算用户提供适合的计算平台。
在详细分析的基础上,本文给出了基于曙光PHPC100的生物计算解决方案;通过生物计算领域两个典型软件:MPIBLAST和GROMACS在曙光PHPC100平台上的性能测试结果,佐证了无论是主要考验定点运算性能的MPIBLAST应用软件,还是主要考验浮点运算性能的GROMACS应用软件,在曙光PHPC100系统上都有着优异的性能表现。
关键词: 个人高性能计算机,PHPC,生物计算,MPIBlast ,GROMACS
编写人员:袁伟/技术支持中心 解决方案中心 高性能计算首席工程师
马少杰技术支持中心 解决方案中心 售前工程师、博士
1.生物计算用户需求
限于多方面的原因,很多生物计算的用户还在使用工作站,乃至PC机作为计算平台,不能满足科研的需要。
事实上,几乎所有的生物计算用户对计算平台都有更高的需求,科研工作需要匹配较高性能的并行计算平台。但用户要购置并行计算机会遇到一些问题,这些问题很有代表性,体现了许多高性能计算用户的共同困惑,解决这些问题,提供适合的高性能计算系统解决方案是用户的切实需求。
用户的困难体现在:
经费有限
只有几十万,甚至十几万的预算,采购高性能并行计算机力不从心,如果采购低端的计算机,则性能、稳定性、易用性等没有保证。
没有机房
没有专用机房,采购了并行计算机无处放置;有的单位虽有中心机房,但计算机放置在机房里给使用管理带来诸多不便,受到很多限制,不能满足用户的要求。
供电问题
没有条件为高性能计算机专门配电,只能使用普通墙电。
噪音污染
办公室环境不容许计算机有很大的噪音,普通的机架式集群或刀片服务器都不可放置在办公室环境。有些用户在办公室划出一定区域使用玻璃墙隔离出来,以放置并行计算机系统,但其噪音仍然比较大,影响用户正常工作和身体健康。
性能效率低
并行计算机系统已经进入高效能时代,对用户而言,重要的是应用性能和产出率,理论性能相对而言并不重要。生物计算平台需要达到一定的性能,以取代工作站和PC机,满足科研对计算处理能力的需要,同时要保证高效率。
安装部署困难
高性能计算平台是相对比较复杂的系统,包括多种硬件,系统软件,并行中间件,应用软件等多个层次。系统的安装部署,以及必要时的恢复也比较繁琐,对于非专业人士更是如此。困难还体现在应用软件的部署和优化。
管理不便
很多用户对并行计算机的使用管理感到是一种负担,有时需要专门的系统管理员来管理并行计算机系统。管理不便给系统的正常使用造成隐患,并且会增加成本。
功耗较大
高性能计算平台是相对较大的系统,功耗相对较大,因此,功耗是用户最为关注的问题之一,往往会影响到用户的抉择。节能环保不仅可以为用户节省电费,也符合现代社会的发展理念。
TCO过高
在几年前,拥有并行计算机系统是相对奢侈的科研条件。现在虽然硬件价格下降较快,但计算系统的TCO仍然不低。TCO是综合成本,很多时候,采用某个方案或某种产品,可以降低某个点的费用,但却增加了其他点的费用,TCO并没有降低,甚至更高了。
解决以上问题,才可以使更多的用户使用到高性能计算机,促进高性能计算的普及。所以市场需要一种新的高性能计算机产品和方案,为用户提供理想的计算平台。
2. 曙光PHPC100
曙光PHPC100是曙光公司在2008年5月推出的新型高性能计算机产品,PHPC100是个人高性能计算机,也可以称为桌面高性能计算机。
曙光PHPC100具有以下特点:
是一种模块化、集群(Cluster)架构的高性能计算机
具有PC机、工作站、低端小型机所无法比拟的性能
无需专业的机房、供电设施、散热设施,可以和PC机、工作站一样,放置在办公桌的桌面附近,适合办公室环境
配置专用的软件包,可以实现软件的自动安装部署
具有良好的易用性,对使用者的门槛要求很低
管理简单方便,无需专门的系统管理人员
曙光PHPC100采用全模块化设计,背板连接,包括5个计算模块,最大支持10颗双核/四核处理器,采用20Gb Infiniband高性能网络和千兆以太网进行互联。
多台PHPC100可以互连,实现系统规模的可扩展,并有效保证用户投资。系统规模扩展后,每个计算模块仍然可以保持高速Infiniband网络连接,保证系统性能的可扩展性。
PHPC100支持WCCS2003、WHS2008、SuSE Linux、RedhatLinux、CentOS等操作系统,配备系统管理软件和应用软件包。
曙光PHPC100有如下优势:
PHPC100是专业为HPC应用而设计的计算平台。
PHPC100在硬件上采用模块化的设计方式,非常便于安装、管理和维护。同时在软件上,采用定制化的高性能计算系统软件环境,专业的高性能设计方便用户的使用和维护。
采用低噪音、低辐射等办公环境设计,便于用户的使用。同时,通过管理软件和应用软件包,降低了用户的使用和管理难度。
采用X86集群架构,易于保证和核心高性能计算环境的同构和兼容。PHPC100可以配置40个处理器核心,并可以通过多台PHPC100互连的方式实现扩展。
3. PHPC100在生物计算中的应用
3.1适用性分析
受限于应用软件的性能可扩展性,并行计算平台并不是规模越大性能越好。根据统计,大多数生物计算应用软件的性能可扩展性在8-60,更多的进程并不能带来性能的提升。
单台PHPC100可以配置5个计算模块,达到40个处理器核心,可以满足大多数生物计算应用的需要。在有扩展需求的情况下,可将多台PHPC100互连,解决系统的可扩展性。6台PHPC100互连,可以实现240个处理器核心的并行处理,几乎可以满足所有的应用需要。
所以与其他计算平台相比,曙光PHPC100可以生物计算用户提供非常具有特色和优势的解决方案,适用在办公室环境,从而避开了需要专用机房等苛刻要求。
3.2生物计算软件包
为了提高系统的易用性,优化应用软件的性能,曙光PHPC100平台配备了高性能计算应用软件包。
软件包中包含了生物计算领域经常使用的多个应用软件,包括MPIBlast,Gromacs,NAMD,DOCK,Palm等。只需要菜单式操作,就可以实现这些软件在PHPC100上的自动安装部署,用户可以直接运行应用程序。
3.4推荐配置
曙光PHPC100计算机基于模块化设计,作为生物计算平台时,推荐配置如下:
模块 |
描述 |
数量 |
备注 |
机箱 |
内含无源中板,单向带宽425Gb/S |
1 |
- |
计算模块 |
2个AMD 双核/4核处理器;8个DIMM槽;两个2.5”热插拔SAS/SATA 磁盘槽位,可选Raid 功能,支持Raid0,1;双千兆以太网控制器;板载BMC 管理子卡 |
5 |
- |
IB模块 |
实现计算模块内部高速互联,同时提供10 个传输速率为20Gb/s 外联端口,支持铜缆和光纤接头的转换; |
1 |
- |
千兆以太网交换模块 |
实现计算模块内部互连,同时对外4 个千兆RJ45 接口 |
1 |
最多配置2 个,实现 |
IO扩展模块 |
为每个计算模块配置1个标准PCI-E插槽 |
1 |
- |
管理模块 |
可实现共享USB 功能、KVM 切换、计算模块状态、故障定位、开关机等全方位管理控制监视功能;可选KVM Over IP 功能模块 |
1 |
可配置2个实现1+1冗余; |
电源模块 |
3+1冗余,每个电源模块500W |
4 |
最多可支持6个,实现3+3冗余 |
管理软件 |
Dawning PHPC Full View Management System 管理软件; |
1 |
- |
操作系统 |
WCCS或Linux |
1 |
- |
生物计算应用软件包 |
包括MPIBlast,Gromacs等生物计算应用软件 |
1 |
- |
3.4方案优势
1). 工作站的价格
PHPC100计算机价格相对较低,标准配置在二十万人民币左右,随配置的变化价格差异也比较大。较低的价格为普通用户使用并行计算机敞开了大门,可以进一步促进高性能计算的普及,从事生物研究的每个组织和个人都可以买得起PHPC100,用得起高性能计算机。
2). 高性能计算机的性能
PHPC具有高性能计算机的性能。PHPC首先是HPC,属于高性能计算机的范畴。事实上,PHPC100可以提供40个处理器核心,通过Infiniband网络互连,可以发挥出优异的并行处理性能,满足大部分生物计算应用的需要。多台PHPC100可以互连,实现系统的规模扩展,同时保持系统性能的可扩展。
3). PC机的使用环境
PHPC100属于个人高性能计算机,也可以称为桌面高性能计算机,可以同PC机一样在办公室环境使用,对机房、供电、制冷没有特殊的要求。PHPC100计算机噪音小,辐射低,从而保证了办公室环境使用的可行性。
4). 生物计算应用软件包
PHPC100配置了生物计算应用软件包,软件包中包括多种生物计算应用软件。软件包可以实现应用软件的自动安装部署,并做了针对性优化。在PHPC100平台上,用户可以直接运行应用软件,避免了软件安装部署以及配置优化的繁琐过程。
5). 易管理使用
PHPC100计算机配置了管理软件,简化了系统的管理维护,管理使用PHPC100计算机就像管理使用PC机一样方便
6). 整体拥有成本低
使用PHPC100计算平台,用户不仅仅是降低了计算机的采购成本,而且节省了机房等基础设施费用,节省了工业专用空调等制冷设备。并且,PHPC100采用了环保节能设计,与其他计算机系统相比,能耗更低。PHPC100计算平台不需要专职系统管理人员,可以节省人力成本。
4.性能分析
4.1分析方法
从计算特性上分析,生物计算的类型主要包括两类:
(一)高通量计算(定点计算)
基因序列比对、药物筛选等
计算任务相对独立,进程间无通信或通信量很小,要求充分利用系统的计算资源,使总吞吐量最高
需要较大的内存,较高的数据I/O吞吐量;较强的并发处理能力
(二)高性能计算 (浮点计算)
蛋白质三维结构预测、蛋白质-蛋白质相互作用、基因进化分析、分子动力学计算
利用大量资源共同解决一个任务,使求解时间最短
进程间通信密集,网络性能要求高
为了掌握PHPC100计算平台针对生物计算应用的性能表现,对两个典型应用软件做了性能测试,并和其他计算平台的性能测试结果做了对比。
MPIBlast是高通量计算的典型代表,Gromacs是高性能计算的典型代表。
4.2MPIBLAST性能分析
(一)软件介绍
BLAST是现在应用最广泛的序列比对软件,用于基因序列的两两比对,由NCBI研制。MPIBLAST是NCBI BLAST的并行化实现,基于标准MPI并行环境,可以免费下载使用。
MPIBLAST软件的计算特点:
定点运算为主;
内存需求量大;
MPI通信比较少,主要是网络文件系统的读写对网络性能有一定要求;
I/O量比较大;
(二)测试平台
测试在3个平台上进行:
曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
曙光A950r-F胖计算节点,8个AMD Opteron8212双核处理器,主频2.0GHz
IBM P575小型机,8个Power5双核处理器,主频1.9GHz
(三)测试结果
使用MPIBLAST 1.4.0版本;数据库使用month.aa,库所占空间为106MB;查找序列的输入文件为F.joh_aa.fasta,查找1500个序列;
测试结果如下:
(三)结果分析
在曙光PHPC100上,MPIBLAST有着优异的性能表现; 单进程的搜索速度较快;多进程并行搜索时,达到了近乎线性的加速比;
2个节点的PHPC100的性能就高于1台A950r-F;
一台曙光PHPC100(39进程)高于IBM P575(8路双核),而价格则大概为其1/5;
4.3GROMACS性能分析
(一)软件介绍
GROMACS是用于研究生物分子体系的分子动力学程序包。它可以用分子动力学、随机动力学或者路径积分方法模拟溶液或晶体中的任意分子,进行分子能量的最小化,分析构象等。GROMACS最初是设计为生物大分子如蛋白质、核酸、脂类等物质的计算、分析服务的。由于其在非成键作用力的互相作用方面具有极强的计算能力,很多研究机构也用其来计算、研究非生物的大分子系统,如聚合体等。
GROMACS是开源软件,最初由荷兰的Groningen大学的Department of Biophysical Chemistry开发。可以免费使用,有基于MPI的并行版本。
并行GROMACS软件的计算特点:
计算密集型的程序,浮点运算量很大;
GROMACS程序对内存的要求很小;
MPI通信频繁,对互联网络性能要求高;
I/O量一般,在REMD模式下稍大
(二)测试平台
测试在3个平台上进行:
曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
SUN4600胖计算节点,8个AMD Opteron8214双核处理器,主频2.2GHz
IBM P575小型机,8个Power5双核处理器,主频1.9GHz
(三)测试结果
GROMACS使用源代码编译,版本为GROMACS-3.3.1;fftw为使用源代码编译,版本为fftw-3.0.1;测试中采用默认优化参数。使用gcc编译器,测试算例为gmxbench中的d.dppc,原子数目为121856,模式10ps;
数据为程序运行最后输出的real time,单位为s;
结果分析
曙光PSC平台发挥了出色的浮点计算性能;
1套曙光PSC的性能为1台SUN 4600(8路双核)的3倍;
1套曙光PSC的性能优于1台IBM P575;
案例分析
曙光服务器用户体验中心成为PHPC100计算机在生物领域的第一个用户。
曙光服务器体验中心是综合性的用户体验平台,许多生物计算的用户在体验中心做应用软件的性能测试。PHPC100部署到体验中心后,作为生物计算平台达到了很好的效果。系统部署简单,放置在值班区的办公环境使用,经过多项测试的验证,PHPC100计算机性能出色。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者