扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
设计一项灾难恢复计划过去要迫使企业实现一个微妙的平衡。要创建一个迅速恢复运营的计划,企业需要投入大量的资本。另一方面,如果一个企业愿意承受更长时间的运营中断时间,成本可以显著下降。在计划阶段,虽然计算机网络在合适地运行,但是,减少成本的力量是最强大的并且经常会占上风。但是,灾难袭击的时候和网络中断的时候,每一个都开始喊叫着要尽可能快地恢复网络的运行。
案例分析
找到一种在这个紧绷的绳索上行走的方法是一个大的挑战。但是,随着虚拟化的出现,部署能够迅速恢复运营并且价格合理的灾难恢复计划是很可能的。
在Transplace公司,我们开发了一个新的基于虚拟化的灾难恢复计划,当时我们在2007年把我们的基础设施迁移到了一个新的生产数据中心。我们还利用那个时间更新了硬件和评估了我们的整个架构。以前,我们每天进行备份并且把数据物理地传送到站点以外的地方。采用这个流程,如果我们在一天的中间发生故障,我们就会有关机半天的风险。这种类型的计划还限制我们每天只能进行一次备份。这就意味着我们可能有失去一天工作数据的风险。这个计划还要求我们配置一台专用的服务器,平时处于待机状态,只有在进行恢复的时候使用。
在我们于2007年年底迁入新的数据中心之后,我们开始规划新的灾难恢复数据中心,并且在2008年2月迁入了那个数据中心。在存储级,我们部署了网络设备公司(Network Appliance)的网络附加存储和SnapMirror软件以便为我们的数据库和应用服务器创建虚拟存储。前者能够让我们把所有变化的副本实时发送到我们的备份设施并且不影响应用程序的性能。生产中任何时候出现记录变化,它都将随时把变化的副本发送到我们的灾难恢复设施。这种共享的存储方法还使我们能够集中管理存储。我们仅在需要的时候购买存储。
在数据库级,我们部署了采用AIX操作系统的IBM P570服务器,利用这种服务器的逻辑分区技术。这种组合使我们把每一台服务器分区为多个服务器,通过共享单个服务器的容量运行多个数据库服务器。在灾难恢复设施中,这个数据库运行四个至六个甲骨文数据库。我们大多数时间里使用这些数据库进行测试和开发。但是,如果有需要,我们可以关闭虚拟服务器并且在同一台服务器上运行甲骨文的灾难恢复实例。这还使我们能够更有效地利用甲骨文的许可证成本。甲骨文的许可证是按照每一个物理服务器内核收费的。
在应用服务器的级别上,我们在戴尔服务器上运行VMware和Windows软件,每一个虚拟机的内容在更新的时候将随时复制到灾难恢复站点。采用VMware和IBM的数据库服务器,我们使用一套服务器进行测试和开发。当我们需要运行灾难恢复的时候,我们关闭用于测试和开发的虚拟机,然后启动用于灾难服务的虚拟机,我们就可以很好地运行灾难恢复了。这些服务器的全部数据和内容很快就能复制完毕。
灾难恢复流程的四个步骤
对于准备制定灾难恢复计划的企业,我们推荐一个四个步骤的流程。这个流程将帮助你制定这个计划的框架并且保证实现一个可靠的灾难恢复流程:
第一个步骤:启动
确保所有的数据能够恰当地传输到灾难恢复中心。确保灾难恢复中心的适当的硬件全部到位,并且保持稳定和运行最新的操作系统。此外,评估所有的应用程序并且确定在缺少哪一个应用程序的情况下你能够运行多长时间。这将有助于你确定最重要的应用程序的优先次序。有些应用程序的存储也许不到一个小时,而没有其它应用程序你也许要用12个小时。这部分计划将变成一个内部的服务级协议。
第二个步骤:测试
对于如何测试和多长时间测试一次灾难恢复计划要制定一个详细的程序和流程。我们建议至少每个季度测试一次。你还需要确定如何衡量成功。这样你可以测试和存档衡量结果,并且以高水平的有效性对比每一个测试结果。
第三个步骤:转换文档
你需要建立一个文档,确切地说明如果灾难袭击或者灾难袭击的时候如何进行转换。有些要素与这个测试流程相似,但是,在实际的灾难恢复中,你实际执行的过程可能会有些不同。在你的IT人员面临很大压力的情况下,有一个文档明确地和全面地说明灾难恢复的步骤是非常重要的。
第四个步骤:恢复到正常的生产基础设施
像如何转换到你的灾难恢复基础实施一样重要的是知道如何恢复到你的正常的生产基础设施。以相反的步骤做事情并不总是那样容易的。你应该测试这个过程。
吸取的教训
把关键的厂商和你内部的IT团队同时召集在一个房间里开发是非常重要的。这将为每一个人提供一个机会发表自己的担心,解释他们负责的部分如何对整个项目做出贡献,并且理解这个项目的其它部分的功能。如果你自己在厂商之间进行协调,重要的信息肯定会在传送过程中丢失。
企业应该认真考虑压缩技术。由于所有的数据需要整天地复制到灾难恢复站点,减少你需要的带宽是非常重要的。这将使你更有效地运行网络。
回顾我们在2007年开始实施的灾难恢复计划,我们感到我们取得了最终的平衡:一种快速恢复运营的简单方法,但是,成本低于传统的灾难恢复系统。毫无疑问,虚拟化在帮助我们完成这个任务方面发挥了重要作用。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者