[直面IT灾难] 直面灾难
宋丽娜/编译 编者按:从9・11事件到最近发生的海啸,从火灾到爆炸,不断出现的灾难使关键行业时时面临毁灭的威胁。为了确保业务免受灾难影响或将影响降到最低,灾难备份、灾难恢复、业务连续性管理等话题逐渐引起人们的重视。
其中,业务连续性管理(Business Continuity Management,简称BCM)是一项综合管理流程,它能使企业认识到潜在的危机和相关影响,制订响应、业务和连续性的恢复计划,其总体目标在于提高企业的风险防范能力,有效地响应非计划的业务破坏并降低不良影响。
不过,要实现业务连续性管理,仅仅依靠数据备份还远远不够。由于对灾难预知的不足,许多做了数据备份的企业未能从中获利的例子并不少见。那么,国内的现状如何?企业如何才能建好灾难备份中心,并制定合适的灾难恢复计划?针对这些问题,本栏目特组织了“业务连续性管理”专题,希望对企业及其他机构的业务连续性管理有所助益。
如果没有一个适当、健全的灾难恢复计划,当IT灾难来临时你就没有资格怨天尤人。
一个项目失败对于您的企业来说可能就像是历经一次“灾难”。但相对飓风、地震、火灾或人为灾难所带来的影响来说,这可能就是小事一桩,不值一提。而作为一名IT专职人员,除了为企业技术财产做好防护外,也要对灾难所造成的破坏最快做出补救恢复工作。至于要为灾难恢复做哪些准备,主要包括以下几点。
第一优先是员工。“这说起来像是有点老调重弹,但却是不争的事实。企业员工是企业最为重要的财富。”《躲过一劫:遇到大灾难时如何保证企业正常运转》一书的作者John Laye说道。这意味着在灾难期间,企业必须知道其员工所在的位置,以及如何最快地与他们取得联系。
当然,仅靠手机进行联络是不行的。卡特里娜飓风期间,飓风就破坏了基站,致使手机通信失灵,因此除了手机以外,企业还必须考虑到远程对讲机等其他通信方式。同时,企业还应采用第三方机构提供的紧急情况应对指南,对员工进行训练,这能帮助员工在遇到灾难时,即便没有接到具体指示也知道该做些什么。
第二优先是数据。“硬件服务器、通信电缆甚至办公大楼都可以换成新的,但你到哪也买不到新的数据。”为世界500强企业提供灾难恢复服务的、位于旧金山的GoldenGate 软件公司市场部高级总监Sami Akbay表示。最好是一开始就做好每天的备份和离线存储工作,同时要确保备份设备的安全性和易访问性――特别是在交通中断、机场关闭时,这点尤为重要。另外,企业还应定期进行备份恢复工作,以测试备份是否正常,如果备份数据被破坏,你应在灾难到来之前就掌握具体情况。
第三优先是软件。“保证应用软件正常运行对获取企业备份来说是极为重要的,如HR管理软件、工资管理软件或电子邮件管理软件,应给予高度重视。”美马里兰州劳雷尔市CAS Severn公司IT咨询副总裁Roy Jackson表示。如果可以的话,最好是不止一人懂得如何操作这些软件。他还表示:“我们发现在许多企业中,一个关键应用软件往往只有管理员一个人知道如何操作。”如果这名管理员不在,那么其企业可就能处于瘫痪状态。
第四优先是硬件。企业的一个数据中心如果不能正常工作了,企业就需迅速地用另一个替代。如果你所在的企业,即时事务处理是关键,那么你会需要一个随时处于“热备份”状态的备用的数据中心,当第一个数据中心无法正常运作时,它就能及时、主动地接管。
第五优先是设备。备份中心或是存储设备仅相距50英里是不够的,尤其当你遭遇类似卡特里娜飓风般大灾难时。“切记企业的第一和第二设备环境必须相距足够远的距离。” GoldenGate公司的Akbay建议道,“若是可以,两者最好是位于不同地区。”
“但若想以上建议能发挥很好的作用,除非企业员工受过相关训练,有足够准备,能应对最坏的情况。关键是使得面对灾难能像面对演练一样可以从容应对。”Laye 说,“如果灾难到来时,你的企业有了很好准备,你的管理团队只当做是演练复习,那么对你的企业来说,这次灾难将不再是一场‘灾难’。”
