扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
令剁手党狂欢、电商兴奋、运维紧张、快递忙碌的“双十一”已过去十天,余温只剩下快递仓库的满满货物和频繁来往的快递小车。当一切重归平静,1207亿的销售额、12万笔/秒的支付峰值、6.57亿个物流订单这些数字都成为了历史,也成为了一个新的电商里程碑。而在这些数字背后,还有默默支撑了双十一的高效运转的一些数字同样值得关注。
100余款定制化服务器
随着网购成为消费者重要的消费方式,电商也已经从单一业务发展到综合业务,其中涉及了传统网站、搜索、大数据分析、交易等诸多领域。因此大型电商公司需要规模更大、更适合上层应用需要的IT基础设施来最大限度的匹配业务的发展,尤其是双十一这种大促时的需求。但是电商各子业务间的需求差异极大,因此定制化服务器的需求被提上日程。按照应用实际需求设计硬件,不做过多的性能冗余,不仅能够实现软硬件的匹配,还能够最大化的降低电商数据中心的TCO,让数据中心从成本中心转变为利润中心。
以IT基础设施供应商的角度来看,从传统的“大规模标准化生产”向“大规模定制化生产”,厂家所需要付出的不仅仅是生产成本的提升,还有研发、测试、市场调研等投入,并推动全供应链配合定制化。截至目前,浪潮为互联网行业预研、定制的服务器,累计超过100款,其中大部分新技术和新产品应用均已应用到各大电商数据中心,有力的支撑了双十一购物狂欢。
举例来说,浪潮通过大范围的数据统计发现,99%左右的互联网行业业务应用对于内存的需求量小于256G,按照目前主流的单条内存16G来算,16条内存插槽完全能够满足绝大多数的客户需求。因此,浪潮在互联网行业定制化服务器SA5212M4的研发阶段,就将内存插槽的数量设计为16条。在内存部分进行精简后,更多的机箱空间则能够留给其他部件,更适合电商和其他互联网应用,该产品也因此成为今年双十一重要的支撑之一。
基于Xeon-D平台的浪潮SA3212M4
又再如,目前电商拥有海量的温冷数据需要存储,这类数据既依赖于一定的计算性能,也注重单位存储容量的成本,但业界主流的存储服务器多数基于英特尔至强 E5或 Atom/E3单路平台,两者间性能差异较大,前者更适合偏热数据存储,后者由于计算性能不足,仅适合冷存储甚至极少访问的冰数据存储,都无法完全匹配电商数据存储的需求。为此浪潮为客户定制基于Xeon-D平台的温冷数据存储服务器,实现了更精细的数据分级存储,极大降低电商数据中心的TCO。在正式发布前,浪潮Xeon-D服务器已经通过了客户测试,并应用到实际的生产环节中。
3-7天完成订单
在传统的产品运行模式下,从设计开始到小批量验证,再到试用阶段,往往需要一年的时间。但随着互联网节奏的加快,以月甚至是周来计算时间也是不足为奇的,在电商行业更为突出。在业务需求配合中,浪潮会设置客户产品经理这样的岗位,直接放到大型电商公司,做企业业务需求的直接分析。只有这样,才能满足从提出需求、定性分析、分配、生产、运输、部署上线这一系列对时间近乎苛刻的要求。在极致的情况下,浪潮可以做到从接到订单到交付客户机房只需要3-7天,这便需要从前期的沟通、实际的生产等多环节压缩时间。
在前期的沟通环节,浪潮制定了完善的滚动预测和备货机制,通过提前与上游供应商和下游客户的需求沟通,减少因缺少部件造成的生产延期。另外,浪潮目前已经与多家大型电商公司打通了供应链管理平台,供应各环节的流程都已实现可视化。客户通过统一的平台下单,订单可直接对接到浪潮ERP系统,进行排产、物料统计、生产状态查询、发货等,极大提升沟通效率。
浪潮新产线应用诸多自动化设备和系统
在生产环节,浪潮拥有国内领先的服务器生产基地,分别位于济南和深圳,有效保障全国服务器快速生产供货。浪潮深圳工厂利用南方成熟的生态链,将物料齐套时间缩短1-2天,对华南数据中心的物流时间缩短1-2天。而在济南,浪潮将整机柜服务器SR和通用服务器的生产分离,提升生产流程的专业性满足双十一的紧急供货需求。
9点前到达客户机房
双十一前期的筹备十分紧凑,何时采购服务器,何时部署测试,何时上线应用都有着严格的时间点,因此电商数据中心对于服务器供应商的供货节奏要求极为严苛。通常来说,公司内部的流程基本处于可控状态,最不可控的环节在于物流运输。
客户对于交付时间的要求一般定义在“天”的级别,交付当天早上或者傍晚到货均不算延迟。但为了保证双十一期间的高效交付,浪潮在这一特殊时期,制定了早上9点之前到达客户数据中心的规定。为何“浪潮标准”比客户要求更高?这是因为交付当天在客户数据中心可能会发生一些无法预料的突发事件,为了保证当天交付上线,需要预留足够的提前量,如果下午到货,上线调试的时间可能就会成为通宵作业。
为保证机器在当天9点前到货,同时物流人员、上架服务人员同步到位,浪潮建立了机房收货人员、内部物流管控人员、现场客服人员的三方联动机制,由浪潮交付经理负责信息确认。不佳天气原因时(如风雪大雾等天气)提前通知客户进行预警,到货前主动联系客户数据中心人员,当天到货后主动与现场确认上架完成进展,形成闭环监控,保障货物的及时安全交付。在特殊情况下,以按时交付为目标,浪潮优先保证双十一需求资源,如物流专车在工厂等待产品下线,与航空公司沟通进行仓位的提前预定等。经过多年的合作,浪潮与客户、物流建立了完善的机制,保证双十一零失误。
10000节点单日交付
“双11”的访问流量是平时流量的数十倍之多,且电商数据中心通常会按照理论评估数值的120%来准备计算、存储资源。因此双十一之前的数据中心扩容规模大、时间紧、要求高,快速的部署上架并测试完成,将能够为后续的调试和应用争取宝贵的时间。通常,标准机架服务器的交付速度在500-600台/天左右,如果客户对于数据中心的理线有特殊的需求,每天能够上线部署的服务器可能只有300台,这样的速度可远远达不到双十一扩容的需求。
浪潮整机柜服务器SR则是破解交付缓慢问题的完美方案。首先SR是以整机柜作为最小交付颗粒度,每台SR的节点是安装在机柜内统一出货的,也就是在交付现场,售后服务工程师可以将一台SR作为一台服务器来看待,但是其中却包含了至少32个节点。并且自带滚轮的整机柜服务器SR可以直接推送至机架位,运输密度远大于标准服务器的6-8台。
而在耗时较多的理线环节,整机柜服务器SR的优势更为明显。在出厂前,浪潮就会在工厂内将节点间互联的线缆部署整理完毕,在客户机房上架部署时仅需要将线缆与数据中心的交换机相连。并且,整机柜服务器SR采用集中供电,每个节点通过内部铜排取电,因此满柜仅有两条冗余电源线即可。另外,整机柜服务器SR可以通过RMC来实现整机柜的集中管理和一键自动化测试、设置。因此交付效率相比通用服务器能够有8-10倍的提升,单日双线并行交付能够达到10000台/天,满足“双十一”期间“快”的主要诉求。
0.5%以下DOA(到损率)
双十一期间,运维人员最担心的是服务器出现资源不足甚至大规模宕机事件,因此网络上流传着在数据中心里烧香、甚至为机架都贴上黄纸符的照片,姑且不论真实性,IT基础设施的质量在双十一期间会经历一次严苛的考验,并且这次考试没有补考,且不允许挂科。
因此产品的质量就是电商数据中心的生命,浪潮拥有业界领先的服务器生产全流程品质管控体系,从来料质量、生产流程,到测试验证等环节都严格把关,每个零部件都有自己的SN码,在产线上进行高精度的装配和测试,从而在源头上确保了浪潮服务器的金牌品质。经过全流程的品质管控,目前浪潮服务器的交付良率超过99.5%,DOA在0.5%以下。
研发阶段,以可靠性实验室为例,产品在实验室中会进行运输环境测试、气候环境测试和极限环境测试,包含三大类共几十种测试,检验产品在各种条件下的可靠性,测定耐受高低温、跌落、高湿等恶性环境的极限。例如进行45度/分钟的温度剧变试验, 在零上100和零下40-50度进行产品温度极限测试,30G震动过载抗振强度,模拟海拔12000米的环境进行高空低气压测试等。
而在产品下线后,质检中心会对所有产品进行出场验收,仅是物理层面的监测就是达到100多项,并且标准严苛,仅是开关机一项,就有冷开关机50次,热开关机400次。此外,还有各类技术测试和针对客户应用的方案测试,如浮点、数据库、中间件等应用软件测试,保障双十一期间的产品稳定高效。
道路检测中,在各重点部位安放传感器
另外,物流运输也是造成服务器损坏的重要原因,尤其是像整机柜服务器SR这种定制化、一体化交付的服务器,运输过程中的质量控制尤其重要,为此浪潮与客户及中国包装科研测试中心联合完成了整机柜产品的包装测试,针对整机柜服务器特性定制化开发专用运输包装。2015年在某次整机柜服务器SR交付的项目中,浪潮进行了道路监控实验,通过在车辆不同部位安装路谱测试装置,实时监测了从济南至客户机房的运输数据,这部分数据也成为浪潮研发、生产、物流等多部门重要的参考,极大减少因运输导致的损失。
72小时无休值守
最后,也是同样重要的是——值守。不论前期交付如何快速、测试如何完善都无法保证双十一当天不出现任何的突发事件,因此专业工程师的现场值守是最后一道屏障。2016年双十一期间,浪潮向各大电商(包括阿里巴巴、京东、苏宁等)派驻专业工程师,进行长达72小时的午休值守,对现场出现的问题进行快速定位和解决。
另外,这些工程师并不是临时、随意派驻的,所有的值守人员都需要经过浪潮服务器工程师认证培训及客户定制售后服务培训认证,并经过一个月的现场学习,通过最终考核后才能成为值守团队的一员。
浪潮全球服务指挥中心
举个例子,为支援国内某顶级电商双十一,浪潮提前一个月就开始进行双十一保障准备,成立专项保障小组,在双十一前夕确认所有备件全部到达客户现场,在客户超过20个机房派驻现场服务工程师,并在总部设置超过50个工程师团队进行24小时待命(包括技术专家、备件管理团队、特殊应急小组),严格执行“1小时内定位故障,2小时内修复故障”。
从“光棍节”到购物狂欢节、再到全球狂欢节,双十一当天的国内电商的整体交易额据保守估计已超过2000亿。双十一改变了中国甚至全球的购物习惯,更是不断刺激着社会基础设施的完善:物流行业因为“双十一”而变得日益高效,云计算和电商架构因此更加健壮,IT基础设施也因“双十一”获得升级和变革。而在这其中,浪潮服务器也伴随了5年的双十一狂欢。在每年双十一交易记录不断攀高的同时,浪潮服务器也一次次的刷新着产品开发、交付、服务等方面的记录,以互联网的速度,交付更好的产品及服务。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者