扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
近年来,很多企业都在面临一大难题,即:如何对他们的基础设施、技术和网络进行灾难备份与恢复,以保证其业务连续性。
一个高性价比的容灾解决方案可以帮助企业以一定的IT投入获得最大的产出,同时很好地保护企业的业务免于灾难事件的影响。
在多年以前的主机时代,很多企业选择建设第二数据中心,以此来平衡生产中心的工作量,并对企业的备份能力进行测试和改进,从而满足业务运营的要求并提供灾难恢复保障。
随着时代的变迁,数据中心的工作量不断膨胀,对第二数据中心的管理和协调也越来越困难。为满足由于业务增长而急剧增加的数据量对数据中心的要求,更大、更复杂的数据中心环境开始出现。
除此之外,众多分布式技术平台和安装在各种层面上的系统软件不断出现,而网络技术的发展也使得“随时随地任意互联”成为可能。
很多企业开始认识到技术已经越来越难以维护和管理,这不仅增加了维持灾难恢复能力的复杂性,也导致了管理一个完全冗余的第二数据中心无法实现,特别是考虑到对财务、运营和技术方面的整体影响。
为了帮助解决这些问题,IT服务提供商引进了多企业共享灾难恢复设施的概念——建设一个配备各种必需技术的综合基础设施,它可以被虚拟地划分为任意大小并进行相应的配置。这一“热站”概念为客户的个性化需求提供了一个资源池,并且全部都由第三方供应商在异地管理,因此可以远离企业的生产中心。这第一次证明了虚拟化灾难恢复策略的可实现性。
了解虚拟化方法
从整体上看,虚拟化方法的主要好处是可以通过整合来实现规模效应。大量的服务器、存储和网络集中在一个资源池中管理,并可以按需配置。从灾难恢复的角度来看,当灾难发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。虚拟化方法有其独特的吸引力,但还需要考虑很多潜在的因素。
在虚拟化技术下,服务提供商可以在个性化需求的基础上为企业提供约定的资源。为实现对硬件的最大化利用,单一物理设备将被虚拟化为多个分区,从而实现对多个环境进行恢复。同时,这种方式也允许企业只购买其需要的资源。
随着时间的推移,对分布式处理恢复的更大需求越来越明显和必要。企业开始认识到利用软件去装备虚拟机器的技术,这种技术可以在恢复场地的独立硬件设备上进行恢复,同时使得明确和描述恢复过程变得更加容易——只需明确定义备份,以及严格遵守硬件的具体要求即可。假设容量、存储和界面足够充分可以为每个个体提供相等或更多吞吐量,就可以实现大量的虚拟机器恢复到一个物理点上。
虚拟化灾难恢复策略的要点
在使用虚拟化灾难恢复策略时需要考虑以下要点:
1、恢复容量
制定虚拟化灾难恢复策略的时候很重要的一点是考虑容量。企业通常会认为恢复时容量利用率不会超过100%。事实上,由于恢复的启动阶段会将系统推向极致,所需容量可能会超过生产容量。此外,恢复过程中有大量的跟进工作,这些工作也需要容量。
2、配套资源
恢复能力虽然是需要考虑的重点,但其它各种支持生产环境的要素也要考虑在内。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络SANs、磁盘簇等)、外围设备(控制单元、终端、刀片等)、基础设施(外部交换机)和网络连通性(交换机、带宽等)。
3、资源独立、网络冗余和可测量性
避免灾难恢复失败的一个重点是确保虚拟化资源保持独立,而不需要依赖主生产环境。网络冗余是指不仅为内部用户,还必须为外部用户(如客户、业务伙伴、供应商等)提供接入。可测量性则是处理灾难恢复和生产运营的工作量峰值所必需的。
4、恢复计划测试
制定虚拟化灾难恢复策略非常重要的一点是考虑对计划的有效测试。测试应在系统层面上全面进行,以有效地了解特定时间段内工作量对虚拟化资源的要求,同时验证业务的完整性和基础设施的有效性。虽然局部的功能测试更容易安排,但却无法保证测试结果的真实性,因此会导致测试的效果大打折扣。
5、重设工作量计划
不论是真实情况下还是演练过程中,恢复时都应该制定详细的计划来管理整个过程中不断变化的工作量。该计划应该包括一份高层认可的正式时间表,一份恢复时资源分配的备选工作计划,一个对偏移工作量的日常备份流程,以及一份在备用场地复原这些工作的经过测试的恢复计划。
6、灾难恢复风险控制
在制定虚拟化灾难恢复策略时应考虑到给业务带来的风险。由于虚拟化的固有弱点,距离可能会受到限制,但地理的多样性必须被考虑在内。恢复场所应该与企业已有的风险规避策略所明确的风险承受能力相符,而不应该是满足技术要求的结果。
7、清晰明确的工作量
在确定构成虚拟池的具体资源之前,很重要的一点是要了解灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及IT支持模块相关的详细计划,从而保证虚拟化环境的可恢复性。
8、保持完整性的规则
包括问题、变更、事件、配置和资产管理在内的严格的系统管理规则是实施任何新的虚拟化灾难恢复策略的前提。这对保持恢复环境的完整性是至关重要的,同时对虚拟化资源池的最终操作、监控和维护的有效性也是至关重要的。
9、业务和IT报告
对灾难恢复项目进程的跟踪、状态的传递和结果的报告是所有灾难恢复项目的重要输出,对于判断IT功能虚拟化所进行的大量投入的效果是非常重要的。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者