扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNetChina服务器站 12月17日集群分析 随着圣诞节的临近,存储经理和IT专家都计划着度过一个轻松的假期。但如果在休假前不对数据中心进行周密计划,这个圣诞节就会让数据中心从休眠状态迅速转变成“瘫痪状态”。于是我们收集了几位业内专家提供的建议,帮助你在休假期间确保数据中心的正常运作。
此时数据中心不宜做较大变动
美国俄勒冈州数据中心管理员Mark Reyer表示:“我们设置了一种模式,只有在数据中心工作负载发生比较大的变化时才会启动这种模式,比如在每年临近圣诞节的最后几个星期。”
他解释说,因为放假期间管理数据中心的工作人员会有所减少,所以不要在这段时间内对存储硬件和软件进行较大的升级更新。他说:“除了重要工作或者紧急事件之外,我们的数据中心基本上在这段时间处于休眠状态。”
和俄勒冈州一样,美国内华达州克拉克郡的官员在假期期间采取了同样的做法。克拉克郡高级系统负责人Rich Taylor表示:“我们所做的就是在此期间不启动较大的项目。虽然这个周六我们要对数据中心进行一次升级,但是在圣诞节我们通常是不会这么做的。”
谨慎备份
虽然平时备份过程中不会出现什么差错,但是这并不意味着在休假期间就会一切顺利,Maxell技术支持经理Al Dripchak这样提醒道。墨菲法则说:“凡事只要有可能出错,那就一定会出错。”
他建议用户仔细检查基础设施,比如充分准备备份所需的原材料,以防在管理员放假期间发生不必要的问题。他说:“负责装卸磁带的工作人员就要放假了,所以你应该确保为每天常规的备份操作准备充足的磁带。”
Dripchak提醒说,虽然这些问题都是很容易就可以避免的,但是如果用户不提前作适当的安排就很有可能在假期期间发生的,“我听说过很多想这样的小问题引起大故障的例子。随时做好充分准备——如果你手下的员工很少,那就确保技术最好的员工在休假期间能够对数据中心进行适当的管理和监控。”
替员工着想
随着IT工作者的工作负担越来越重,假期对他们也就意味着放松身心、与家人共度美好时光。Taylor表示,大多数员工放假之前做的最后一件事就是检查存储阵列和升级更新软件。
他说:“你当然不希望员工围着数据中心设备工作,而心思却在别的地方。”他强调,企业公司应该精确计划休假期间实际需要多少名员工来值班。
遇到紧急情况可以向厂商寻求帮助
“与其他机构一样,我们也非常需要更多的技术人员。”Taylor还解释说,他的机构缺乏足够的资源来对员工进行系统的培训。
他表示,在休假期间技术熟练的员工可能不在工作岗位上,这时厂商方面的工作人员就可以帮助企业机构解决各种故障问题。
他说:“如果技术人员已经离开这个州去休假了,我们就不得不给厂商打电话寻求帮助。比如一台EMC的设备出了问题,我们就可以给EMC工作人员打电话,他们很快就会赶来解决故障;如果交换机有什么问题就可以给博科公司打电话。”
Dripchak也赞同这种应对假期发生故障的解决办法。他说:“如果你找来解决故障的人技术不太熟练的话,一定要确保他们有足够的工具和资源来应对可能出现的紧急情况,比如有硬件和软件厂商的技术支持等等。用户通常会首先确认厂商的技术支持能力,保证可以在故障发生时马上得到帮助。”
不要玩失踪
放松身心固然重要,但是如果数据中心出现什么紧急状况的话,保证联系通信顺畅就显得十分重要了。
“所幸的是我们的员工住处离公司都不远,系统管理人员都配备了可以在家里进行工作的VPN连接,他们在接下来的几个星期都将把手机设定在开机状态。”
不放过存储之外的小细节
Dripchak提醒说,即使能够得到厂商方面的技术支持,但这并不意味着用户就可以在故障发生时从厂商那来调来所需的零部件。“一些IT部门会储存备用零件,但是他们有备用的驱动器吗?”Dripchak提醒用户应该确保圣诞节期间快递公司能够及时送到需要替换的零部件。
他说:“数据中心会在人们休假期间暴露出许多潜在的危险,IT部门应该提前找出根源所在,并确保故障发生时可能实施有效的应对策略。”
“休假期间系统可能会一片混乱:设备管道漏水、冷却系统发生故障、所有设备温度过高……。我甚至听说曾经有工作人员被一根电源线绊倒,带动另一端服务器上的插头脱落而导致服务器当机……不可能的事总会发生。”