科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航



ZDNet>服务器频道>ZD评测>两组服务器故障解决办法

两组服务器故障解决办法

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

本文列出了两组服务器故障解决办法:第一例:HP ML370G5服务器一COPY文件就蓝屏。第二例,HP DL580G4、DL380G5服务器关机后重启。

来源: 2007年08月15日

关键字:蓝屏 服务器 HP CPU

ZDNetChina服务器站 8月15日x86服务器技巧  

    第一例:HP ML370G5服务器一COPY文件就蓝屏。

    两台出到光明的HP 370服务器,其中有的台客户说一COPY文件就会蓝屏。上周六3号,我坐车过去检测了,去之前准备了两条原装内存,一个CPU套件,一个128M BBWC。

    到客户处,客户已经把另加的一个CPU 取下(定为B CPU),只留一个原装的CPU(定为A CPU)在上面运行,客户说安装一个CPU没问题。所以我觉得是不是两个CPU不匹配的问题。我把自己带来的CPU(定为 C CPU)及电源模块加上,开机运行。

    因为也担心会不会是内存的问题,所以我开机后就用smartstar 光盘检测了CPU和内存的全部技术指标。检测后全部通过,没问题。于是就启动到2003下,按客户所说COPY文件,开始通过网络COPY 了4个任务,每个任务3G数据,通过,没问题。再COPY 了9个任务,每个任务3G数据。大概COPY了10分钟后,出现蓝屏了。

    蓝屏信息虽然有,但提供不了有用的信息。我还是怀疑会不会是A和C 两个CPU的匹配问题。于是我又把原装的A CPU取下,再换上以前的 B CPU。让B和C 两个CPU配对运行。换好后再开机,还是通过网络COPY 了9个任务。不到一会儿又蓝屏了。

    这下有点范愁了,因为内存没问题,如果确实是CPU不匹配的问题就不好搞了。再说是在光明街道办,离公司非常远.搞不定的话不再来一次就麻烦了。

    因为客户说一个CPU是没问题的,于是我取下C CPU。让一个B CPU在机器上运行。这样开机后再COPY,这次我COPY 的是本机上的一个任务,6G数据。这次COPY时我紧盯着幕,系统很快蓝屏,在蓝屏前系统有提示“磁盘缓存……..”,因为时间很短,很快变成蓝屏了,记不下全部信息。但我判定跟阵卡有关,因为只带了一个BBWC,没带卡,只能把它先换了试一试。换了后再开机。开机还是和以前一样,COPY 一个任务,6G数据。通过后没蓝屏。

    于是我迅速关机,把A CPU加上,再让A和B配对运行。启动后,我COPY本机上9个任务,每个任务3G数据。30分钟后COPY完成后没死机。再通过网络COPY 9个任务,3G数据,也通过没问题。据此客户和我判定是阵列卡上的BBWC的问题。

    在此我特别想说的是CPU匹配的问题。以前去联想培训的时候,老师是这样说的,两个CPU一定要是同一个匹次,才能往机器上加,不然容易出问题。如果你以前买的是一个CPU,后来想要加到两个,老师说联想一般是这样处理的,把你以前的拿回来,再给你两颗同一匹次的CPU。但通过这次的事情,我认为这个匹配的问题是不存在的,只能说是厂家为了让你买他的配件,才提出来的一个说法。

    HP的机器,包括服务器,工作站,PC加内存的话都会有提示。但服务器加CPU,或是减CPU,系统没任何提的。只要能检测得到两颗,OK没问题,系统照样起来。

    去年我去车公庙送两台HP 570 G3,要在客户那加CPU,分别加到两颗。但我带去的两个CPU,和一台原配的CPU配对,机器自检测时报错。最后我的解决办法是,把原装的拆下来,把带来的两个CPU放在一台机器里,启动没问题。再把拆下的原装CPU跟另一台原装CPU配对,OK没问题。这样才解决。

    所以我认为,只要加上的CPU在机器处自检时能通过,进入到系统后就不存在CPU匹配的问题了。

    第二例,HP DL580G4、DL380G5服务器关机后重启。

    上个月去迈瑞生物,说是好几台HP 380和HP580关机后重启。去客户机房一看,先检测一台580的服务器,确实是客户所说的情况。选择关闭2003系统后,系统又重启了。客户安装的是windows 2003 64位R2英文版,是正版软件。    

    试了好几次,情况依旧。于是我用“深山红叶”(一种WIDOWS PE光盘),试一试。启动完成后再关机,发现可以关机。

    这时我发现在客户的外部健康指示灯在闪,到后面一看,机器配的是双电源,但只接一根电源线,所以我要求客户把电源线接上。并跟客户说,可能是跟没接电源线有关。要求安装重新安装一个WIN 2003试一试,客户同意了。

    我重新安装了一个中文版WIN2003,安装好后,关机后,OK,关掉了,没问题。据此我判定,应该跟服务器硬件没关系。于是我又重新拿客户的正版64位2003光盘安装,安装完成后我,再试关机。OK,能正常关机。试了好几次,同样可以关机。跟客户说可以是配了双电源,没接电源线有关。

    我正准备签单离开时,机器又不行了,又不能关机了。当时头都大了。不过我在旁边仔细看过客户的每个操作,客户只在机器上做了三个操作,一、给一块网卡设置了IP。二、在系统里屏蔽了另一块没工作的网卡。三、启动了自动更新。

    于是我就逆向操作,把那块网卡重新启用,再关闭自动更新。因为不可能跟配IP有关,这一点没管。设置完成后再关机,OK,又可以关机了。重新启动后,再屏蔽网卡,自动更新选项不动,再关机,又不行了,关机后又重启了。所以判定跟屏蔽了系统的网卡有关,才导致不能正常关机,客户把其它的服务器调整设置后,全部可以正常关机。

    这个问题这几天上HP官方论坛看了,也有同样的问题提出。可能是跟R2的版本有关,解决的办法是在系统设备里,选择网卡/属性/高级,把receive side scaling的值,由Enable改为Disable。据说这样改了后,即使是屏蔽网卡,关机也不会重启,但现在没机会试。

    上一次去深圳湾海关,安装WIN2003 SP2,安装后网卡不能局域网内其它网卡通讯。但另一台安装的是SP1补丁。又是正常的。于是建议客户安装WIN2003 SP1才解决。现在上HP论坛看,解决的办法也是一样,把receive side scaling的值Disable,就可以解决。

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅ZDNet技术邮件将是您的最佳途径之一。