华为服务器保持高性能和高可靠性的秘密 原创

高性能方面,华为服务器在此颇具口碑,共打破300多项性能测试世界纪录;质量更可靠,故障率低于业界15%。如何做到的?今天我们从华为服务器信号质量一探究竟。

通过第三方调研机构数据可以看出,华为服务器出货量不断攀升,得益于其持续通过高强度的研发投入和聚焦创新,从而为用户提供高可靠、高性能、简单易用的计算平台。

高性能方面,华为服务器在此颇具口碑,共打破300多项性能测试世界纪录;质量更可靠,故障率低于业界15%。如何做到的?今天我们从华为服务器信号质量一探究竟。

信号质量是服务器的性能和可靠性关键一环,然而信号质量具有隐蔽性,不为用户感知,常被用户忽略。本文详解华为服务器信号质量。

0.025mm意味着什么?

信号好坏与链路质量相关。链路好比一条高速公路,信号好比汽车,高速公路路况好,汽车可以在高速路快速行驶,并安全到达目地;如果高速链路阻抗不一致,就好比高速公路路面坑坑洼洼,信号在该通道上传输,会造成信号的衰减、失真,导致信号的误码。特别是CPU间的UPI链路、CPU与外设之间PCIe链路和CPU与内存之间的DDR链路,信号质量好坏对服务器性能至关重要。

在多路关键业务服务器,如8100 V3服务器,高达6000多条高速链路(UPI、DDR4、PCIe),有的链路长度超过500mm,链路过长且数量多,过孔、电容、连接器连接导致链路复杂,有限的空间内链路间相互干扰和受外部干扰影响会成倍增加。华为工程师细心思考与精心设计,采用三维立体设计方法:计算节点分布在Y空间排列;前后IO交错布局,充分利用X空间;利用高密高速连接器降低Z空间;再将链路精度精确到0.025mm,成功化解信号链路阻抗不一致性难题。

信号仿真,挑战极限

完成设计只是高质量第一步,接下来是信号仿真。

以PCIe高速链路为例,信号在PCB间是通过BGA ball,过孔、电容、连接器连接在一起,要求信号在穿过上述部件时,阻抗要保持一个很小的波动范围,确保信号在这条高速路上跑得畅通,需对各部件进行3维全尺寸建模仿真优化,确保链路阻抗波动最小;经历几百次的信号仿真测试与优化,信号质量高规格达标,部分信号波动范围小于CPU要求的30%。

也许你要问信号质量很难为客户感知,为什么去挑战极限、追求卓越?

这么做的背后是因为,极端环境下,机房温度或者湿度超过规范范围时,只有信道阻抗足够小,信号仍能高质量传递,系统才能正常运转,业务才能继续进行。

华为独门绝技:眼图检测

每一个优秀的产品除了优秀的设计,还必须经得起严苛的测试。

华为服务器除了常规的测试外,还包含非正常环境加严测试。加严测试包括:1、满荷运载;2、温循测试;3、电压超压和低压拉偏测试;

更值得说的是生产引入信号数字眼图检测,这是华为独门绝技,所谓的眼图好比人的眼睛,眼睛正常开启,说明这人的精神很好,如果眼睛睁的过大或者过小,说明这人很疲乏。在生产阶段,引入眼图自动化检测,快速检测出其它手段很难发现的信号质量不良的单板。

由此,华为用创新的检测方法,避免不良设备流入市场。

所以,总结来看,华为经过加严测试的服务器,信号质量能得到保证,最终将体现在性能高、非正常环境稳定运行、长时间稳定运行等质量优势,这也是更多客户选择华为服务器的理由之一。

来源:至顶网服务器频道

0赞

好文章,需要你的鼓励

2017

08/14

15:38

分享

点赞

邮件订阅
白皮书