灾难来时如何应对 [如何更从容地应对灾难?]
建立跨部门的业务连续性协调小组,预先制订紧急预案,并依靠灾难指挥中心按既定计划部署救援,以保证企 业的业务恢复,这是应对灾难的最有效办法。 2008年年初一场不期而至的雪灾袭击了我国南方大部分地区,这场从1月中旬持续到2月初的大范围低温雨雪冰冻给这些地方带来了严峻的考验,电力供应首当其冲,由于电力中断进而也给通信带来巨大的困难。有关资料显示,截至1月27日,移动通信共有21210个基站因停电中断通信。截至1月24日12时,受灾最严重的省份之一的贵州共有4833个移动通信基站因停电而中断服务,中断服务的基站占全省移动通信基站总数的三分之一。
如今,经过相关行业和众多部门的通力合作,电力供应和移动通信已经恢复正常,而这场雪灾带给我们的思考却并没有结束。在灾害来临之前,我们是否可以通过采取一些措施来尽可能降低灾害的损失?对企业而言,在灾难面前还能更主动些吗?
业务连续性管理
近年来,因为恐怖活动、种族战争、海啸、暴雨、飓风、雪灾等各种天灾人祸导致企业陷入困境的事情我们时有耳闻。作为应对上述种种小概率的大灾难、确保企业经营正常进行的有效办法,业务连续性管理((Business Continuity Management,BCM))正在被人们所关注和接受。
目前,业界比较成熟的业务连续性管理标准是英国BSI推出的BS25999。该标准的编写成员来自英国电信公司、电力公司、水务公司等企业,它结合业界的最佳实践,力求确保企业的生存,同时满足公司治理的要求、供应链的要求和国家整个基础设施运转的要求。
BS25999将业务连续性管理定义为: 连续性管理是一个整体的管理过程,它能鉴别组织潜在的威胁,并提供构建弹性机制的管理架构,确保具有有效反应的能力,以保护它的关键利益相关方的利益、声誉、品牌以及创造价值的活动。
该标准提出了一个生命周期的模型,包括:
BCM策略的制定: 为后续BCM框架开发提供指导。
BCM方案管理: 包括职责的分配、在组织中实施和持续管理。
了解组织: 了解组织的产品和服务、识别关键活动,搞清楚其供应链上的依赖关系。
确定BCM战略: 先找出业务最大容忍的中断时间,这是非常关键的一步,最大中断时间要满足行业监管和利益相关方的要求,这意味着需要资源的投入,包括人员、场所、设备、技术、供应商、利害相关方、信息。
开发和实施BCM响应: 根据企业规模的不同,可能有一个或多个连续性的计划,针对不同业务的特殊部分或者特殊的场所和情形。计划要详细而不冗长,可读可执行; 具体包括事件的应急处理计划、连续性计划和灾难恢复计划等内容。
演练维护和评审: 通过演练证明BCM的计划是有效的,并不断地维护保持更新。新的灾难场景和新的业务类型都会造成BCM的改变。演练的方法包括从桌面到部分或全部模拟演练等各种形式。要注意的是,成本费用和产生的演练效果是不同的。
把BCM植入组织文化: BCM应对的就是小概率大灾难事件,关键点在于通过不断的意识培训和演练来加强全体员工的应变能力。高层要明确职责分配,确保BCM成为企业核心价值和企业文化的一部分。
为通信制订紧急预案
目前,我国已经就《信息系统灾难恢复规范》出版了国家标准GB/T 20988-2007,明确了数据备份系统及相关网络、基础设施及运行维护管理能力的要求。但我们仔细分析一下这次雪灾,已经超越了信息系统的灾难恢复要求。从下图可以看出,通信系统的损坏没有得到及时恢复最根本的原因是道路中断。
我们知道,通信系统的恢复和交通部门的应急预案执行得如何是相互影响的,根据通信系统的最大容忍中断时间可以测算出基站容忍中断时间和线缆容忍中断时间、应急通信车到位目标时间等。各部门就可以按照既定目标制定自己的连续性计划以保障通信的顺畅。
BS25999中还明确规定应急响应小组必须判断灾害程度、控制灾害情况、与相关利害方通报灾害状况,确认灾害的发生,同时选择时机启动业务连续性计划。在这样的灾难面前,最重要的就是,应急响应小组是否能联系上各方面相关的联络人并及时告知,启动运输、通信、水、电力等基础行业的应急响应和业务连续性计划。同时,准确适时地公开报道不但有助于避免灾害的扩大,也有助于减少公众的恐慌,使赈灾有序有效地进行。
值得欣慰的是,在这次灾难过后,国家相关部门已经开始了反思: 是不是应该有个常设机构监控新的威胁、面对新的和最近可能出现的灾难制定跨部门的连续性计划,并分解指标、常年演练以达到养兵千日、用兵一时的效果。
他山之石
伦敦计划
如何更好地应对灾难和危机,我们可以借鉴国外政府机构的一些做法。
英国伦敦为了应对各种危机灾难事件政府成立了“伦敦准备着 (London Prepared)” 这样一个组织。该组织成员有政府官员(如伦敦市长)、政府部门和事业机构,另外还包括大型基础设施行业的企业(如公用能源公司、港口、铁路、地铁)等。
“伦敦准备着”组织常设的机构每季度召开一次会议,参加的人员除了发起的组织成员还有政府部门与大型企业。每次讨论的内容包括上次的会议后续跟踪事项、最新威胁和灾难(如禽流感、干旱、热夏);更新现有的伦敦恢复计划(如加入对生化、核武器的防范、水灾的防范和恢复计划);回顾现有的伦敦紧急恢复策略; 与其他紧急计划的接口,如英国国家的紧急计划等。
“伦敦准备着”组织通过常设的机构和负责联络的秘书小组制订了伦敦的应急策略,同时公布在网站上,便于伦敦的企业、个人以及外来的游客下载使用。而针对企业也提供了一系列的模板和工具方便它们评估风险、识别业务联系的要求、建立自己的业务连续性计划。该组织还针对伦敦市民和游客提供了丰富的资料和各类联系方式便于实施救援和自我保护。同时,特别的计划还在不断制订出来,如针对2012年的伦敦奥运会已有相应的紧急计划以应对恐怖活动和意外的天气和疾病灾害。
“伦敦准备着”还组织不同形式的演练,包括桌面、模拟和真实场景,并在网站上公开近期的演练计划以测试计划的可行性和完备性。
