服务器大批量交付速度太慢?提升8倍够不够

目前,业界主流的标准机架式服务器单日单机房交付速度在1000台左以下,并且在大型数据中心的交付过程中,由于需要考虑数据中心整体可靠性和便于管理,往往需要更多的测试和部署时间,一般来说单日500-600台的交付速度已经是平均速度。

目前,业界主流的标准机架式服务器单日单机房交付速度在1000台左以下,并且在大型数据中心的交付过程中,由于需要考虑数据中心整体可靠性和便于管理,往往需要更多的测试和部署时间,一般来说单日500-600台的交付速度已经是平均速度。

在国内,BAT的年服务器需求量都接近20万台,并且每年都以较高的比例进行增长,以20万台每年的需求量来算,按照标准服务器每天550台的平均交付速度,那么至少364天来进行交付,也就是说,如果采用标准服务器进行交付,那么意味着全年都要在机房进行交付!

面对日益增长的服务器需求,服务器的交付速度已经不能适应业务应用的高速发展。如何提升大批量服务 器的交付速度?目前来看最好的形式就是提升交付颗粒度,将原有以服务器作为交付最小颗粒度,提升为以整机柜甚至模块化数据中心。浪潮联合百度实现单日单机 房5000节点的SmartRack交付就是最典型的案例之一,那么让我们看看究竟是如何将大批量服务器交付从单日500提升至5000节点的。

交付是一项系统工程

先简单介绍下一般的服务器交付流程(详见下图)。在服务器生产完成后,通过物流运输到客户数据中心 所在地,由售后服务人员在现场进行包装拆除,并通过小型拉车运输到数据中心内。再通过简单的上电测试无问题后,工程师将服务器上架到数据中心内的机架上, 连通电源、网络,并将各种线缆按照客户要求进行整理。最后会将服务器上电,通过测试脚本进行交付完成前最后的系统性测试。

服务器大批量交付速度太慢?提升8倍够不够

接下来我们将交付各流程拆解,剖析下SmartRack为何能够8倍于标准服务器的交付速度。

我们不是服务器的搬运工!

标准机架服务器(1U、2U、4U或者更高)交付前是独立包装的,为的是保护服务器免受运输颠簸和 冲击威胁,但是这也造成现场拆箱将会花费更多时间。并且在服务器从数据中心外部运输到内部,需要用到小车,每台小车承重有限,且服务器最高堆叠8台,运输 效率大打折扣。在后续的工作,包括上架、接线和测试环节,都需要逐台进行。

而SmartRack是以整机柜作为最小交付颗粒度,每台SmartRack的节点是安装在机柜 内统一出货的,也就是在交付现场,售后服务工程师可以将一台SmartRack作为一台服务器来看待,但是其中却包含了至少32个节点。并且自带滚轮的 SmartRack可以直接推送至机架位,运输密度远大于标准服务器的6-8台。

理线难!剪不断,理还乱

在整个交付过程中,理线是最费时间的工序之一,每台服务器的电源线和网线都要和数据中心预设线路匹配,然而确保连接正 确只是第一个步骤和最简单的要求。由于数据中心的服务器数量极多,相应的电源线和网线也纵横交错,如果每台服务器的线缆没有进行整理,就会增大后续运维的 难度。因此,交付人员会将每个机架所有的线缆进行绑定,并按照既定的线路进行固定,工序繁琐却需要极为细致,平均每机柜的理线就需要1.5小时左右。

而在这一环节,SmartRack的优势更为明显。在出厂前,浪潮就会在工厂内将SmartRack节点间互联 的线缆部署整理完毕,在客户机房上架部署时仅需要将线缆与数据中心的交换机相连。并且,SmartRack采用集中供电,每个节点通过内部铜排取电,因此 满柜仅有两条冗余电源线,与之对比,标准服务器则需要32条。

上电测试,能不能批量操作?

一般情况下,为了保障数据中心的稳定性和交付的效率,需要两道测试流程。第一次测试是在数据中心 外,主要是验证服务器是否有短路或者不能开机现象,防止部署完成后引起整个数据中心的电力故障。标准服务器需要逐台进行测试,而SmartRack满柜仅 需要加电一次。另外,在冬天或者天气较冷的季节,为防止凝露,服务器需要静置半小时以上,这将会大大影响交付速度。

第二道测试是在上架完成后,主要是测试服务器系统、软件以及固件等信息是否正常。传统服务器间的互联管理采用网络设备进行连接,扩展性受到网络设备和网络性能的限制,并且网络协议复杂,层次众多,使得集群模式下的传统服务器管理受到严重限制。而SmartRack突破了传统服务器的运维管理架构方案,以整机柜作为整体管理解决方案,通过RMC(Rack Management Controller)集中管理单元实现整个系统资源的实施监控,RMC是SmartRack的信息查询和状态监控的平台,具有节点资产定位,功耗监控,散热调控三大基本功能。

与相同数量的通用服务器相比,SmartRack到货检验时间由原来的1~2小时,减少到5分钟内完成。并且后期,通过RMC设置管理策略,自动监控各模块运行状态。节点单元、网络单元、供电单元全部前端维护,散热单元后维护,能够极大方便运维。

数据说话,交付时间到底省在哪?

服务器大批量交付速度太慢?提升8倍够不够 

我们通过两组交付数据来看下,标准服务器的与SmartRack的差距到底在哪。以上数据是以交付5000台/节点服务器为目标,20人交付团队在同一交付地点下的数据。

通过这组数据,我们可以直观的看到SmartRack通过在拆包装、搬运、上架、监测四个环节的出色表现,交付5000节点仅需7.6个小时。

因此,在相同机房环境、交付规模的前提下,SmartRack交付速度能达到标准服务器的7.6倍。而从单日交付量来看,标准服务器不足1000台,而整机柜将超过5000台!

整机柜,未来海量数据中心的主流交付形态

未来几年,将有数以千亿的手机、平板、可穿戴设备等各种智能终端,乃至各种感知设备接入到互联网上,数据的总量将超过过去200年的总和,信息需求的巨大变化,会让数据中心的集中化、规模化趋势更加明显。

有数据显示,到2020年,70%的服务器将集中部署在5000台以上规模的数据中心,将会有更多的超过50万台规模的超大型数据中心出现,服务器需求量的快速增长与交付速度体术的停滞的差距,成为影响数据中心发展的重要瓶颈。因此更大交付颗粒的整机柜服务器,是未来数据中心主流服务器形态演变的趋势。采用SmartRack能够将交付效率提升近八倍,并且凭借集中供电、集中散热和集中管理,降低至少15%的功耗和12%的TCO。

来源:ZD至顶网服务器频道

0赞

好文章,需要你的鼓励

2016

06/17

09:27

分享

点赞

邮件订阅
白皮书