科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道IBM RS/6000巡检内容及操作指导

IBM RS/6000巡检内容及操作指导

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,分析结果报告给客户 若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,分析结果报告给客户。

来源:天新网 2008年6月16日

关键字: 操作系统 网卡 小型机 RS/6000 IBM

  • 评论
  • 分享微博
  • 分享邮件

  IBM RS/6000巡检内容及操作指导

  1. IBM RS6000小型机机房要求:

  1. 机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。

  2. 温度(摄氏 ℃)

  10 ℃-40℃

  湿度(%)

  8% -80%

  2. 设备故障灯分类:

  主机故障灯

  面板上不能有数字显示,如果有的话,说明系统有故障。

  7133磁盘阵列故障灯

  告警灯为黄色表示有故障

  磁带机故障灯

  告警灯为黄色说明有故障或磁带机太脏,须清洗。

  3. 系统错误报告(Error Log)的检查:

  硬件故障检测命令:# errpt -d H -T PERM

  若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,分析结果报告给客户

  软件故障检测命令:# errpt -d S -T PERM

  若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,分析结果报告给客户

  4. 有否发给root用户的错误报告(mail):

  #mail

  1. 观察所有未读消息,注意有关diagela的消息。

  2. 常用命令:

  h [] Display headings of group containing message

  t [] Display messages in or current message.

  n Display next message.

  q Quit

  3. 对发现的问题详细分析,结果报告给客户

  5. 件系统的检查:

  命令:

  # df –k

  %Used为文件系统的使用率。所有文件系统的使用率不能大于80%

  6.磁带机清洁的检查:

  命令:

  #/usr/lpp/diagnostics/bin/utape -cd rmt0 –n

  显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。

  6. 信系统的检测:

  1. 网卡的状态

  命令:

  #ifconfig –a

  输出判断:

  en0: flags=e080863

  inet 192.9.200.2 netmask 0xffffff00 broadcast 192.9.200.255

  en1: flags=e080863

  inet 192.9.201.1 netmask 0xffffff00 broadcast 192.9.200.255

  主备网卡的flag为UP属正常。同时检查ip地址和netmask是否正确。

  2. 路由的检测

  命令:

  #lsattr –El inet0

  authm 65536 Authentication Methods True

  hostname h24 Host Name True

  gateway Gateway True

  route net,,0,172.16.23.81 Route True

  bootup_option no Serial Optical Network Interface True

  rout6 FDDI Network Interface True

  3. 络的检测

  命令:

  #ping [ip address]

  输出判断:

  用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。

  RAID 的Hotspare 属性是否打开

  #smitty ssaraid? Change/Show Attributes of an SSA RAID Array

  检查Enable Use of Hot Spares属性是否为YES

  8.系统DUMP设置的检查

  命令:

  #sysdumdev –l

  输出判断:

  结果应为

  primary /dev/hd6

  secondary /dev/sysdumpnull

  copy Directory /var/adm/ras

  forced copy flag TRUE

  always allow dump FALSE

  dump compression OFF

  若不正确请用下列命令修改:

  #sysdumdev –P –p /dev/hd6 –s /dev/sysdumpnull

  9.HACMP 配置检测: Cluster Verification:

  命令:

  # /usr/sbin/cluster/diag/clconfig -v '-tr'

  输出判断:

  结果无Fail项输出。

  10.系统硬件诊断:

  命令顺序为:

  1.#diag

  2.Enter

  3.Diagnostic Routines

  4.System Verification

  5.All Resources

  6.F7

  输出判断:

  结果应为No trouble was found.

  11.补丁程序(PTF)的检查

  1. 系统维护补丁版本为ML09,检查命令为:

  #instfix –i |grep ML

  12.系统参数的检查

  1.HIGH water mark for pending write I/Os

  # lsattr -El sys0 |grep maxpout

  输出判断:

  结果应为

  maxpout 33 HIGH water mark for pending write I/Os per file True

  2.LOW water mark for pending write I/Os

  # lsattr -El sys0|grep minpout

  输出判断:

  结果应为

  minpout 24 LOW water mark for pending write I/Os per file True

  更改命令为:

  #chdev -l sys0 -a maxpout='33' -a minpout='24'

  3.Syncd参数

  # grep syncd /sbin/rc.boot

  输出判断:

  结果应为

  nohup /usr/sbin/syncd 10 >/dev/null 2>&1 &

  更改命令为:

  #vi /sbin/rc.boot

  4.aio参数

  # lsdev -Cc aio

  输出判断:

  结果应为

  aio0 Available Asynchronous I/O

  # lsattr -El aio0

  输出判断:

  结果应为

  minservers 1 MINIMUM number of servers True

  maxservers 10 MAXIMUM number of servers True

  maxreqs 4096 Maximum number of REQUESTS True

  kprocprio 39 Server PRIORITY True

  autoconfig available STATE to be configured at system restart True

  fastpath enable State of fast path True

  更改命令为:

  #smitty aio

  5.Limits文件的设置:

  #ulimit –a

  输出判断:

  结果应为

  time(seconds) unlimited

  file(blocks) 2097151

  data(kbytes) 262144 //尤其是这项参数

  stack(kbytes) 32768

  memory(kbytes) 32768

  coredump(blocks) 2097151

  nofiles(descriptors) 2000

  更改命令为:

  #vi /etc/security/limits

  更改data为524288

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章