科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算企业如何在云服务中断时避免受伤

企业如何在云服务中断时避免受伤

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

亚马逊今年4月那次出了名的云中断导致大量著名网站的宕机,其中包括foursquare和Reddit,但是亚马逊的很多企业级云服务客户却安然度过了这次中断风险,并没有因此而受损。

来源:网界网 2011年8月22日

关键字: 亚马逊 SaaS 云计算

  • 评论
  • 分享微博
  • 分享邮件

亚马逊今年4月那次出了名的云中断导致大量著名网站的宕机,其中包括foursquare和Reddit,但是亚马逊的很多企业级云服务客户却安然度过了这次中断风险,并没有因此而受损。

这些企业级客户的系统驻留在多个可用域中,要么在传统数据中心留有备份,要么选择了备份的云服务商设置,一旦出现状况便可安然防范。

硅谷的一家照片共享公司SmugMug即便在其同行们纷纷落马之时也安然无恙。这里面的部分原因是因为它没有使用亚马逊的弹性块存储——这个特殊服务组件在系统中断时也会中断。

当然,该公司还将其系统在亚马逊的多个数据中心做了备份——这些数据中心就是亚马逊所谓的“可用域”。

SmugMug的CEO Chris MacAskill认为,加入其他的同行也能像他们那样将其应用做分布式备份的话,也能够安然度过危机。他还建议这些公司也使用多个亚马逊可用域,而且各个域之间的隔离性最好高于亚马逊可用域之间的隔离性。当然,亚马逊会对使用多个可用域收取更高的费用,所以必须仔细考虑企业的需求。

SmugMug如今非常依赖亚马逊,利用后者基于云的简单存储服务(S3)存储客户的照片和视频。SmugMug还用到了很多的EC2实例。但是它没有用到弹性块存储——该服务是每个EC2实例自带的,通常用于存储各种运营数据——而是仍然使用了传统的数据中心。

但是即便如此,SmugMug还是遭遇了一些损失,比如在亚马逊中断服务的那一周里,该公司的一台核心路由器、备份服务器和一台核心的主数据库服务器都宕掉了。“我一点儿都不想再去处理路由器或者数据库的故障,这也就是为什么我们始终采用云服务的原因,”MacAskills说。

他补充说,即便遭遇到服务中断,他们从亚马逊所获得的云服务依然要比他们自己的好,也要比其他云服务商的服务好。“我们对亚马逊非常信任。”

一家以色列公司Kitely只使用了亚马逊的一个可用域,但幸运的是,这个域逃没有出现服务中断。

不过这家公司已准备从这次中断事件吸取教训。“我们计划将我们所有的服务分布在多个可用域上去,”Kitely的研发副总裁Oren Hurvitz说。

Kitely是一家运行云会议与云协作环境的公司,其平台是OpenSim,他们会对服务进行连续检查以确保其所有服务始终在线,正常运行。

“我们的系统设计基于这样的假设:任何服务都有可能在任何时刻出现中断故障,如果我们发现有台服务器没有及时响应,我们就会停掉它,开启一台新的服务器。”他说。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章