您的位置: 网界网 > 周报全文 > 正文

[周报全文]人为失误与数据中心管理

2010年08月24日 15:22:25 | 作者:CNW.com.cn | 来源:网界网 | 查看本文手机版

摘要:在导致数据中心故障的所有罪魁祸首中,技术问题所占比例其实很小,而人为错误却占据了大约70%的份额。

标签
人为失误
数据中心管理

【CNW.com.cn 专稿】由于某员工无意中把两条网线连接到一台错误的网络集线器上,整个校园网络陷入瘫痪状态;一名员工在进入数据中心时由于路径不熟竟掉入“地洞”而受伤;在数据中心的温控器设置被人从华氏温度改为摄氏温度后,系统由于过热而宕机......类似情况举不胜举。大多数的数据中心灾难并非缘自技术问题或自然灾害,而是人为失误

根据数据中心性能研究机构纽约正常运行时间学会提供的数据,目前人为失误引发了大约70%的数据中心故障。该机构副总裁Julian Kudritzki表示,他们分析了4500起数据中心事故,其中包含400次完全宕机事件,最后得出了如上结论。Kudritzki最近还发布了保持数据中心可持续性运营的一套指南。

Kudritzki称,该结论并不令人感到意外,“运营管理是最大的弱点所在,但它也是避免宕机的最大机遇。好在企业可以对数据中心工作人员进行再教育。”

市场研究公司Pund-ITResearch分析师Charles King表示,不管是因为大意,还是因为培训不够、最终用户干涉、资金紧张或简单的错误,人为失误是不可避免的。由于当今IT系统日益复杂,数据中心工作人员工作时间过长,一些本来可以避免的小故障时有发生。而且随着企业越来越依赖技术来达到自己的商业目标,这些错误已经变得更加危险,让企业付出的代价也越来越高。

连线错误导致交换机超载

印第安纳医科大学安全分析师JeramyJay Bowers表示,四年前由于一名IT员工误将两条网络线缆连接到一台下行集线器上,该大学数据中心交换机出现了超载现象。

这次事故发生时,Bowers是该学校的系统工程师。该学校的IT部门有两处办公场所,一处在学校办公楼,另一处则在相邻的学校附属医院大楼上。Bowers认为这本身就不是一种合理的网络设计方案。

两处办公场所通过一条光缆连接,在医院大楼的IT办公室中,该光缆被连接在一台12口交换机上。Bowers表示,IT人员可以轻松地把该设备从校园网断开,然后通过墙上的插座将其连接到医院网络中。

有一天,Bowers在家休息时接到电话,得知学校服务器机房的交换机超载,导致它托管的所有服务都无法访问。Bowers表示,当数据包通过时,正常情况下交换机绿色指示灯会不断闪烁,但此时它们却基本是长亮状态。

Bowers立即通过电话开始排障,他确定校园网络没有进行过任何修改,然而他想到了上面提到的光缆,他让同事拔下这条光缆,结果超载交换机恢复了正常。再插上该光缆后,该交换机又超载。这说明问题出在该光缆的另一端,也就是附属医院大楼那边。

最后被查明的故障原因是,一名IT人员由于项目需要,刚刚搬到医院IT办公室,由于需要连接更多设备到网络中,他无意中将两条来自校园网交换机的网线插到同一台新增的集线器上,这样就在网络中形成了一个闭环,数据在该环中不断被重复发送,最后导致校园网交换机的超载。

虽然这次事故并没有让学校IT部门改变现有不合理的网络设计,但至少现在IT部门知道了一件事情:私自乱接网线的行为是不对的。通过这次事件,Bowers确信,相比技术错误,人为错误所带来的故障数量要更多一些。

因小失大

节省投资当然没错,但如果省了不该省的钱,最后的结果可能是付出更大的代价。在下面的例子中,一家公司因为没有多花35美元再多买一盘备份磁带,结果导致所有数据丢失。

1999年,Charles Barber在一家医疗器械公司担任技术支持经理,该公司生产一种基于服务器的独立设备,用来连接到跑步机来收集患者压力测试数据。该公司的客户之一是圣路易斯的一家小型医疗诊所,该诊所的行政助理同时也兼任IT人员。

Barber说,这位行政助理能力很强,但她不是一名经过专业培训的IT人员。

在一个周五的晚上,她听到该设备的服务器发出奇怪的噪音,意识到硬盘出现了故障。周六她购买了一块新硬盘,在备份了原先数据资料后,在新硬盘上安装了微软的Windows Server和SQL Server。Barber曾经告诉过她如何配置服务器的步骤,因此这位行政助理按照步骤顺利地完成了配置工作。

然后她在周日和周一开始恢复数据并对系统进行测试,测试一切正常。周一晚些时候开始正式投入使用,对一名患者进行了测试。

但周二早晨她致电Barber称,她从备份磁带恢复到服务器上的所有数据信息都丢失了。Barber解释道,“她每天都要对整个系统进行一次完全备份,不幸的是,当她去重[注]新安装其备份时,看到的所有数据就是周一那位患者的数据。”

由于她只有一盘备份磁带,而这盘磁带已经被用来备份周一的测试数据,但却忘记了这会清除此前的所有历史数据。Barber表示,一盘磁带的价格约为35美元,真希望她的老板多花点钱让她多买盘磁带,但现在的结果却是丢失了三个月的数据。

123

参考资料

1.重复数据删除:是一种数据缩减技术,通常用于基于磁盘的备份系统,旨在减少存储系统中使用的存储容量。它的工作方式是在某个时间周期内查找不同文件中不同位置的重复可变大小数据块。重复...详情>>

[责任编辑:程永来 cheng_yonglai@cnw.com.cn]