扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
亚马逊今年4月那次出了名的云中断导致大量著名网站的宕机,其中包括foursquare和Reddit,但是亚马逊的很多企业级云服务客户却安然度过了这次中断风险,并没有因此而受损。
这些企业级客户的系统驻留在多个可用域中,要么在传统数据中心留有备份,要么选择了备份的云服务商设置,一旦出现状况便可安然防范。
硅谷的一家照片共享公司SmugMug即便在其同行们纷纷落马之时也安然无恙。这里面的部分原因是因为它没有使用亚马逊的弹性块存储——这个特殊服务组件在系统中断时也会中断。
当然,该公司还将其系统在亚马逊的多个数据中心做了备份——这些数据中心就是亚马逊所谓的“可用域”。
SmugMug的CEO Chris MacAskill认为,加入其他的同行也能像他们那样将其应用做分布式备份的话,也能够安然度过危机。他还建议这些公司也使用多个亚马逊可用域,而且各个域之间的隔离性最好高于亚马逊可用域之间的隔离性。当然,亚马逊会对使用多个可用域收取更高的费用,所以必须仔细考虑企业的需求。
SmugMug如今非常依赖亚马逊,利用后者基于云的简单存储服务(S3)存储客户的照片和视频。SmugMug还用到了很多的EC2实例。但是它没有用到弹性块存储——该服务是每个EC2实例自带的,通常用于存储各种运营数据——而是仍然使用了传统的数据中心。
但是即便如此,SmugMug还是遭遇了一些损失,比如在亚马逊中断服务的那一周里,该公司的一台核心路由器、备份服务器和一台核心的主数据库服务器都宕掉了。“我一点儿都不想再去处理路由器或者数据库的故障,这也就是为什么我们始终采用云服务的原因,”MacAskills说。
他补充说,即便遭遇到服务中断,他们从亚马逊所获得的云服务依然要比他们自己的好,也要比其他云服务商的服务好。“我们对亚马逊非常信任。”
一家以色列公司Kitely只使用了亚马逊的一个可用域,但幸运的是,这个域逃没有出现服务中断。
不过这家公司已准备从这次中断事件吸取教训。“我们计划将我们所有的服务分布在多个可用域上去,”Kitely的研发副总裁Oren Hurvitz说。
Kitely是一家运行云会议与云协作环境的公司,其平台是OpenSim,他们会对服务进行连续检查以确保其所有服务始终在线,正常运行。
“我们的系统设计基于这样的假设:任何服务都有可能在任何时刻出现中断故障,如果我们发现有台服务器没有及时响应,我们就会停掉它,开启一台新的服务器。”他说。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者