科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道NFS服务器故障与问题诊断

NFS服务器故障与问题诊断

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

与其它网络服务一样,使用网络文件系统NFS服务器可能出现问题。对这些问题的故障诊断涉及理解跟踪 NFS 问题的策略、识别 NFS 相关的错误消息和选择适当的解决方案。当跟踪到一个NFS服务器问题时,请首先孤立三个主要故障点以确定其中是哪一个不工作:服务器、客户机或网络本身。

来源:IBM官网 2009年9月9日

关键字: 服务器 NFS

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共4页)

  检查进程

  在服务器上的命令行输入以下命令:

  ps -ef

  如果服务器似乎运行正常且别的用户得到及时的响应,请确保 biod 守护程序正在运行。请尝试以下的步骤:

  1. 请运行 ps -ef 命令并在显示中寻找 biod 守护程序。

  如果它们没有运行,请继续步骤 2 和步骤 3。

  2. 通过发出以下命令停止 biod 守护程序。

  stopsrc -x biod -c

  3. 通过发出以下命令启动 biod 守护程序:

  startsrc -s biod

  要确定是否一个或多个 biod 守护程序没有响应,当用户怀疑一个或多个 biod 守护程序挂起时可以运行几次 nfsstat -c 。如果远程进程呼叫(RPC)客户机读或写数中没有明显的更改,则一个或多个 biod 守护程序没有执行它们的任务。您只能确定一个或多个 biod 守护程序处于非激活状态;但不能确定哪一个是处于非激活状态。

  检查网络连接

  如果 biod 守护程序正在工作,请检查网络连接。 nfsstat 命令确定是否正在丢信息包。使用 nfsstat -c 和 nfsstat -s 命令来确定是否客户机或服务器正在重新发送大的数据块。信息包丢失或服务器繁忙容易导致重发。重发率在百分之五或以上就认为是高。

  重新发送的可能性可以通过更改通信适配器传输队列参数来减少。 系统管理接口工具 (SMIT)可以用来更改这些参数。

  下面是给 NFS 服务器的推荐值。

  通信适配器最大传输单元(MTU)和传输队列大小

  适配器MTU传输队列

  令牌环

  4Mb

  16Mb1500

  3900

  1500

  850050

  40(如果 nfsstat 命令超时请增加。)

  40(如果 nfsstat 命令超时请增加)

  40(如果 nfsstat 命令超时请增加。)

  以太网150040(如果 nfsstat 命令超时请增加)

  每个令牌环速度的较大

  MTU 值会减少处理器使用并显著提升读/写操作。

  注:

  1. 如果重新发送持续,则请将这些值应用于 NFS 客户机。

  2. 网络上所有节点必须使用相同 MTU 大小。

  设置 MTU 大小

  要设置 MTU 大小,请使用基于 Web 的系统管理器( wsm )或 SMIT 快速路径 smit chif 。请选择相应的适配器并在“最大的 IP 包尺寸”字段中输入一个 MTU 值。

  ifconfig 命令可被用来设置 MTU 大小(且设置 MTU 大小为 8500 时 必须 使用)。 ifconfig 命令的格式是:

  ifconfig tr n NodeName up mtu MTUSize

  其中 tr n 是您的适配器名称,例如 tr0。

  另一种设置 MTU 大小的方法把 ifconfig 命令和 SMIT 组合。

  1. 为令牌环将 ifconfig 命令(如前例中所示)添加到 /etc/rc.bsdnet 文件。

  2. 输入 smit setbootup_option 快速路径。将“使用 BSD 风格”字段切换到 是 。

  设置传输队列大小

  通信适配器传输队列大小由 SMIT 设置。输入 smit chgtok 快速路径,选择相应的适配器,然后在“传输”字段输入一个队列大小。

  修正挂起的程序

  如果在与文件相关工作期间程序挂起,NFS 服务器可能已停止。在这种情况下,可能显示以下错误消息:

  NFS服务器 hostname 没有响应,仍在尝试

  NFS服务器(hostname)已当机。这表示 NFS 服务器、网络连接或 NIS 服务器有问题。

  如果您的机器完全挂起,请检查已从其安装文件系统的服务器。如果一台或多台服务器当机,请不用担心。当服务器重新启动时,程序会自动继续。没有文件会破坏。

  如果一个软安装服务器死机,别的工作不受影响。当尝试访问软安装的远程文件时,超时的程序会失败并发出 errno 信息,但是您仍然可以访问您其它的文件系统。

  如果所有服务器正在运行,请确定是否正在运行同一服务器其它用户也有问题。超过一台有服务错误的机器表示服务器上的 nfsd 守护程序有问题。在这种情况下,请登录到服务器并运行 ps 命令来察看是否 nfsd 守护程序正在运行并累积 CPU 时间。如果不是,您也许可以终止并重启 nfsd 守护程序。如果不起作用,您必须重启服务器。

  如果其它系统似乎启动并运行,请检查您的网络连接和服务器连接。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章