扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
当今,随着企业业务系统对IT 系统的依赖性越来越强,IT 系统已成为企业生存与发展的技术神经。因此,各种原因的故障或灾难导致的IT 系统中断,都可能引起业务中断。而关键业务的中断无疑将会对企业生产重大的不利影响,包括客户流失、股价下跌、丧失市场机遇、丧失生产能力、公众形象和企业声誉受损等等。重大灾难事件带来的关键业务中断,甚至有可能导致公司一蹶不振或者倒闭。因此,通过提高IT系统的连续稳定性及其应对突发灾难的恢复能力,从而强化业务连续性和高可用性(Business Consecutive &Availability Plan,BC&A),对企业具有极为重要的意义。
业务连续性及高可用的概念和要求
业务连续性是指一个企业为了维持其生存,当发生突发事件或灾难后,在一定的时间内必须恢复关键业务功能的强制性要求。这就需要预先发现可能会影响企业关键业务能力和过程的所有问题,并采取相应的预防和处理策略。业务连续性强调的是企业业务的不间断能力,即在灾难、意外发生的情况下,企业无论是从组织结构、业务操作和IT 系统,都能以适当的备用方式继续业务运作。
高可用的IT系统是指在支撑企业业务运营时间段内,能够提供稳定持续的系统连接,能够满足业务对系统恢复性能的要求,同时能够保障业务数据的安全。可用性的要求是根据企业业务的要求制定的,可以被管理和度量,而可用性的提高则伴随着投入的提高。
此外,企业业务系统存储的数据包括帐务数据、客户数据、交易流水、系统日志以及其它应用系统数据,具有很强的实时性要求,数据的重要性是毋庸置疑的。一旦系统出现故障或其它原因引起的故障致使数据丢失,将直接导致企业工作无法进行,从而造成不应有的损失。因此,如何进行备份,出现故障或灾难如何恢复,也是现代企业业务系统在设计时就必须解决的一个重要问题。
BC&A循环四阶段:科学降低企业风险
业务连续性和高可用性建设需要一整套经过实践检验的方法论,才能帮助企业科学降低运营风险。惠普从多年的实施服务经验出发,总结了一套业务连续性和高可用建设的方法论,包括客户需求分析、系统设计、实施和整合,以及后续日常管理和改进等四大部分内容。
通过大量的实践我们认识到,业务连续性和高可用性建设是一个长期的实施过程,必须定期或在系统发生重大变更时重新分析需求、变更设计,重新部署和整合。因而,业务连续性和高可用建设是一个闭环过程,需要不断重复这四个阶段。图1就 生动地描述了这种持续不断的循环过程。
图1 惠普业务连续性及高可用方法论:BC&A循环四阶段
围绕这四个阶段,科学的业务连续性与高可用解决方案 还必须从技术、流程、人员三方面着手,帮助客户确保关键业务应用的正常运作。以惠普自身的BC&A解决方案为例,惠普首先从客户的业务目标出发,分析客户具体的业务流程,在详细分析支持这些业务流程的应用系统的基础上,了解它们一旦发生危机将对业务产生的影响。同时还对客户面临的风险加以评估,根据各种风险对业务的影响程度划分优先级。根据上述业务影响的分析和风险评估,惠普结合行业最佳实践,制定企业业务连续性指导方针和详细解决方案规划,最后达到风险管理的目标,从而为企业搭建真正永续运行的IT基础设施与服务体系结构。该架构将涵盖物理环境、网络、IT 基础设施、人员、业务流程等各个方面的实施内容(如图2所示)。
图2 惠普BC&A解决方案模块构成图
根据企业业务对IT系统的要求,改良企业IT基础架构,是保证业务连续性和高可用性的另一个重要方面。基于惠普长期的实践经验和业界公认的业务连续性方法论,我们将改良方案的实施分为七个连续的步骤:
一、业务问题确定:根据行业特点和企业自身情况确定关键业务,分析业务流程。这个阶段确定客户环境中对实施业务连续性和高可用所必须的基本组成,分享业界最佳实践和研究如何应用到客户当前的IT系统运营中,对客户当前环境进行总体分析。
二、业务影响分析:分析灾难发生对企业业务造成的影响,在事先设定的时间范围内,突明确定义发事件或灾难对每个业务部门在财务和运行方面的影响。基于预先定义的场景,对每个业务部门进行评估,并按照企业规定的类型和优先级进行分类。影响包括无形的(如企业形象、客户满意度等)和可量化的(如收入损失、资产损失等)。通过分析,将系统应用和业务功能按照关键、要害、重要、可暂缓等进行分类。
三、风险评估:主要是对现有客户系统的风险及灾难管理手段、能力和水平进行评估,其目的是为了了解客户系统灾难控制和预防的现状,从风险管理的角度了解要提高客户系统的灾难规避和控制能力还需要做的努力和工作,并以此作为确定具体项目实施目标的依据。
四、风险优先级划分:根据业务影响分析风险评估的结果,对企业可能面临的风险划分优先级。
五、最佳实践和指导方针确定:根据业务影响分析和风险评估的结果,检查现有的IT架构和运行管理的现状,确定实现客户业务连续性和高可用需求的差距,并结合行业最佳实践,制定相应的业务连续性和高可用指导方针,包括恢复策略下的系统架构、关键应用系统的恢复优先级及其回复技术的选择等。
六、解决方案规划和实施:在确认业务连续性和高可用指导方针后,进行解决方案的规划和详细设计。根据企业面临的风险,采用不同解决方案降低风险或提高灾难恢复能力。解决方案覆盖技术、人员、流程等方面和IT 系统的各个层面--包括物理环境、网络、IT 基础设施、业务流程,并协助客户进行技术实施、人员培训和流程制定等,包括灾难恢复计划(DRP)和业务连续计划(BCP)。
七、风险管理:通过后续的变更管理、日常监控以及定期测试和演习等服务内容,确保系统的高可用和业务连续性。
图3 惠普BC&A方案实施七步骤
在经过以上七个科学严格的步骤(见图3),企业IT基础设施的抗风险和灾难恢复能力将得到显著提高。在惠普实现以业务为导向的交付式运营过程中,惠普独特的IT服务管理思维可帮助企业全面了解整个IT情况、增强IT与其支持的业务之间的沟通,并跨所有技术领域简化和改进IT流程,降低总体拥有成本,实现并保持法规遵从,提高生产率和效率,提供更高的可用性,降低意外事件的风险,减少在故障、变更和事件管理活动上所耗费的时间和精力。