扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
石油勘探模拟需要超大规模的高性能计算集群,同时也需要消耗大量的电能。近年来,随着石油勘探、油藏模拟的广度、深度和精度要求的日益提高,石油企业数据中心里的服务器规模也在不断膨胀。6月27日,英特尔在内蒙呼和浩特举办了主题为“绿色计算 从‘芯’开始”的中国石油行业与英特尔2008年度高性能计算研讨会。会上,中石油的代表就提供了这样一个信息,2006年该公司数据中心的电费总支出是490万元,而到了2007年,这一支出攀升到了790万元,预计2008年将达到1300万元。如何在保证数据中心持续扩展的前提下降低能耗成本,已经成为从用户到IT厂商所普通关心的话题。
一般而言,提升数据中心能效需要从服务器等IT设备和数据中心两个层面入手,比如在服务器方面,可以采用每瓦特性能更高的服务器,采用虚拟化进行服务器整合,启动服务器能源节省功能,通过应用优化来提高单系统容量,而在改善优化数据中心方面,可以改进机房送风,采用新型散热交换系统,采用新的机房设计等等。为此,英特尔解决方案部中国大区技术部经理梁岩介绍说,英特尔会从芯片、组件、系统及至整个数据中心层面来提供产品技术和方法,以帮助用户降低数据中心的能耗。
一、服务器层面
具体到服务器的功耗分布来看,据统计,处理器所消耗的能源会占到30%,其次内存和磁盘会分别占11%和6%。另外特别值得注意的是,DC/DC直流电转换会损失10%,AC/DC损失25%,风扇占9%。
梁岩介绍说,在这一层面英特尔所提供的提高能效的方法很多,包括低电压版处理器、芯片级节能技术、高密度主板、SSD固态磁盘技术、动态功耗节点管理器等等。
1)低电压版处理器
目前,英特尔正在销售推广的低电压版50W 45纳米至强5400,虽然在价格上会比相对应的普通至强5400要贵一些,但它能够在保持性能一致的前提下提供更低的功耗。一般而言,低电压版至强5400比普通CPU要省30瓦特的电能,减少功耗达35%。也许这对于一台服务器来说算不了什么,但是对于服务器数量多达几百台甚至上千台的数据中心而言,其一年运营下来所节省下来的能耗开支是相当可观的。
2)减少CPU闲置功耗
由于CPU在睡眠和关闭状态下的闲置功耗不会产生任何生产价值,因此,芯片厂商也一直在努力降低这方面的功耗支出。以至强5400 LV为例,其闲置功率只有16瓦特,而前一代65纳米产品是30瓦特左右。
3)Turbo Mode芯片级功耗调节在下一代的Nehalem处理器中,英特尔还将引入一种Turbo Mode的技术,即当功耗条件许可时,负载较重的应用软件可以自动按照预先定义好的步骤来提升处理器的主频,以满足当前处理的需要。Turbo Mode可以充分利用处理器的能耗空间。因为,在多核处理器中,并不是所有的核都一直处于负载激活状态,也不是所有被激活的核都运行于满功耗状态,这样,所有额外的功耗空间都会被转换为其他活动核的更高主频。
比如,假设四核处理器的设计功耗是80瓦特,当其中两个核被激活,另外两个核闲置时,可能只用了40瓦特,也就是还有40瓦特的剩余功耗,这样Turbo Mode会让机器自动把那两个被激活的内核的主频提升起来,以达到80瓦特的水平,从而可以在最短的时间内完成作业,然后让CPU回归到耗电更低的闲置状态。
系统在Turbo Mode模式下的时间决定于负载的具体情况,Turbo Mode可以在BIOS中被激活或关闭,然后在操作系统中进行调用控制。
4)SSD固态磁盘
由于具有低功耗、高性能的特性,SSD固态磁盘也开始受到英特尔的关注。据了解,一块普通SATA硬盘的功耗是15W,而一个固态磁盘只有2瓦左右,而且是只有在运行的时候才耗电,不用的时候不耗电。
目前,英特尔可以提供两种规格的SATA固态磁盘产品,其中MLC产品主要用于PC机上,但在某些场合也能用于服务器,虽然MLC写的速度不够快,但有的应用如搜索引擎平时不写,只是查询,所以也比较适合用于这类服务器上。另一种是SLC产品,主要用于企业级设备上,32GB、64GB产品可以提供非常强的读写性能,既可以作为磁盘的替代品,也可以作为内存的扩展来使用。
5)动态功耗节点管理
功耗控制不仅在芯片层得到了实现,在节点层、机柜层也同样可以实现。英特尔动态功耗节点管理器(Intel Dynamic Power Node Manager)就是这样一种技术。
它可以通过编程的方式,针对一台服务器,或一个机柜,或根据应用来事先定义好目标功耗值,然后监控系统运行在这个目标功耗值以下,而对性能不会产生大的影响。英特尔曾在百度做过一个测试,发现当把一台标称300W的机器功耗降到260W时,对其性能影响非常小,这样有一个好处是,我们可以通过软件来将机器的最大功耗控制在260W,如果我们有10台服务器,就相当于省出了一台服务器的功耗空间,从而可以在一个机柜中放入更多的服务器。
6)高密度主板与软件
此外,英特尔还向业界提供半宽的高密度主板,让系统厂商可以在一个1U高的机箱里面放入两块这样的双路主板,相当于在一个机箱里实现两个双路系统,从而实现更高的计算密度。
在软件层面,英特尔除了本身会提供线程工具、函数库等来帮助用户进行应用优化外,以提高系统利用率外,还大力支持了www.lesswatts.org这样一个网站,该网站上列举了Linux平台所有可用于实现能效管理的工具、API、第三方函数的开放源码,对于具有一定开发能力,习惯于使用开源平台的用户如高性能计算非常有意义。
二、数据中心层面
当然,服务器只是一个方面。
而且,实际上,在一个数据中心里,服务器负载本身的耗电比重往往还比较低,大量的电能都被电源、PDU配电设备、服务器风扇、UPS、空调等供电散热设备给消耗了。有统计表明,目前大多数数据中心里计算负载、电力传输和散热制冷系统所占有的功耗比重大约是1:1:1。也就是说,实际用在计算负载上的电能只有1/3。梁岩认为,对英特尔来说,就是要尽量提高计算负载所占用的功耗比重,减少供电制冷设备的能耗比重。
1)数据中心优化设计
梁岩建议用户可以先用PUE指标(注:PUE = 数据中心总设备能耗/IT设备能耗,PUE是一个比率,基准是2,越接近1表明能效水平越好)来衡量一下自己机房的能效情况。目前英特尔自身的数据中心PUE可以达到1.6。
他进一步谈到,在数据中心规划布局方面,我们可以将热/冷区隔离,改善通道设计,加强气流管理,包括架高地板的气压设计等。同时可以采用更高能效的部件,如高效率的CRAC、PDU、UPS。另外在实验管理方面也有许多措施可用,包括机柜和服务器功耗及散热监控、服务器软件配置、虚拟化、紧耦合制冷等。
比如,很多用户在设计数据中心时,过去典型的制冷设计中往往没有充分考虑冷热区混合带来的效率降低,导致服务器过热、设备损坏以及潜在的服务器宕机,每机柜4KW的需要很难达到。而如果通过更合理的冷热区隔离和架高地板的静态压力平衡,同样的数据中心可以支持到每机柜12-14KW的水平,而且无需对现在的基础设施的容量做改变。
2)加快服务器更新周期
当然,计算设备的能耗对供电散热的能耗也是有着间接的影响的。计算设备的能耗越高,不仅需要更多的电力,同时也意味着会产生更多的热量,需要更多的制冷设备,从而消耗更多电能。实际上,随着近两年IT技术如多核处理器、虚拟化、刀片等的快速发展,已经对整个数据中心的能效情况产生了重要的影响。如同样是达到3.7万亿次每秒浮点运算性能,在2002年需要25个机柜,512台服务器,占地1000平方英尺,耗电量达到129KW,而到2007年,只需要1个机柜,53台刀片服务器,占地仅40平方英尺,耗电量为21KW。可见,在过去5年里,整个数据中心能源效率提升了6倍以上。
这一点也说明,通过加速服务器更新周期,比如采用更先进的45纳米四核处理器的服务器,采用刀片服务器,可以在给定的负载情况下,通过提高服务器性能,来降低空调系统和地板空间的成本。但这需要用户在服务器更新成本与未来老化设备的能源消耗成本之间进行仔细权衡比较,以获得更好的投入产生比。
总之,近年来,随着宽带视频、在线游戏、搜索等WEB2.0应用,以及石油勘探、图像渲染、气象等高性能计算应用的飞速发展,越来越多的用户会采用机架服务器集群或刀片服务器集群这种高密度计算方案。而大量的服务器堆放在一个机房里,其能耗密度也必然会随之攀升,从而导致电能、托管等费用成本的增加。因此,我们需要从多个层面来尽可能地降低能耗,减少碳排放。