客户担忧超大型云服务商PostgreSQL服务的停机问题

研究显示客户对超大规模云服务商PostgreSQL实例的正常运行时间可靠性感到担忧,为小型替代供应商提供了填补空白的机会。Foundry研究发现,82%的PostgreSQL云服务用户担心云区域故障,21%在过去一年中经历过此类故障。91%使用PostgreSQL的组织要求每月停机时间不超过四分钟,即99.99%的正常运行时间,24%的组织要求停机时间少于30秒。这促使PlanetScale、pgEdge等分布式PostgreSQL服务提供商推出高可用性替代方案。

分析 最新研究显示,客户对超大型云服务商PostgreSQL实例的正常运行时间可靠性表示担忧,这为规模较小的替代供应商提供了填补市场空白的机会。

研究公司Foundry发现,在PostgreSQL常见云服务用户中,82%的用户担心云区域故障,21%的用户在过去一年中经历过此类故障。

在2025年前六个月,数据库流行度排名服务DB-Engines发现PostgreSQL是增长最快的数据库,排名上升超过13个点。它总体排名第四,仅次于Oracle、MySQL和微软SQL Server。2023年,这个开源数据库成为最受开发者欢迎的数据库,这很可能是因为三大领先云服务商的服务使开发者能够轻松使用它。

但上周Foundry对212名来自企业和SaaS业务的IT决策者进行的调查发现,91%当前使用PostgreSQL的组织要求每月停机时间不超过四分钟,即约99.99%的正常运行时间,而24%的组织目标是少于30秒的停机时间。

这项研究由分布式PostgreSQL供应商pgEdge委托进行。Gartner副总裁兼分析师Adam Ronthal表示,目前尚不清楚PostgreSQL服务可靠性SLA是否真的存在问题。"当然,致电Gartner咨询服务的客户目前并没有明确将此认定为问题。"

然而,他呼吁云服务提供商跟踪和记录正常运行时间和可靠性,以消除"传言"并确定特定服务是否确实存在问题。

微软提供Azure Database for PostgreSQL作为完全托管的服务,包括单服务器、灵活服务器和超大规模选项。AWS和谷歌都提供基本的PostgreSQL服务,以及Aurora和AlloyDB等与底层云基础设施更紧密集成的选项。

替代方案的兴起

任何发现这些服务无法满足其正常运行时间需求的用户都有一系列PostgreSQL和PostgreSQL兼容服务可供选择,这些服务具有分布式后端以增强可靠性。例如CockroachDB和YugabyteDB。

与此同时,以基于YouTube开发的分布式关系数据库Vitess的分布式MySQL服务而闻名的PlanetScale,在本月早些时候推出了PostgreSQL服务。

CEO Sam Lambert在接受The Register采访时表示,PlanetScale服务建立在开源PostgreSQL之上,而不是妥协兼容性,并使用该公司为MySQL/Vitess开发的专有操作器。

"操作器是确保PlanetScale具有如此强大的正常运行时间和可靠性的神奇组件:它管理所有节点、状态和拓扑。实际上就是让PostgreSQL适应这个系统,"他说。

Lambert表示,当前服务没有分片,但正在与客户开发分片服务。他说这将是PostgreSQL的"测试等效",但不是100%兼容。"如果有人想使用它,他们应该迁移到非分片服务,我们将努力帮助人们从那里转到分片版本。"

他说YugabyteDB和CockroachDB是"令人印象深刻的"分布式数据库服务,但声称它们没有提供相同程度的PostgreSQL兼容性。"它们甚至没有那么兼容,"他说。

例如,PostgreSQL兼容性指数显示CockroachDB约为40%,而Yugabyte约为85%的兼容性。

Lambert表示,PlanetScale当前的PostgreSQL服务是100%兼容的,而分片服务到达时可能是99%兼容的。

为Web应用开发者提供开源反应式数据库的Convex已经开始从AWS Aurora迁移到PlanetScale。该公司在博客文章中说:"多年来,我们在AWS Aurora之上运行Convex。体验还算可以。Aurora确实做到了宣传的内容:它可靠,扩展性相当好,与AWS其他部分集成得很好。但'可以'不是我们想要停留的地方。"

该公司表示,在已经使用新服务的精选项目上,"性能提升令人难以置信"。

另一家希望利用超大型云服务商PostgreSQL服务可靠性问题和分布式系统兼容性问题的公司是pgEdge,它承诺提供基于开源PostgreSQL构建的多主分布式数据库,允许用户在不同位置拥有多个主数据库。

联合创始人兼CEO Phillip Merrick在接受El Reg采访时表示,这个完全兼容PostgreSQL的服务提供"相当极端水平的高可用性"。

作为副产品,该服务还有助于解决需要从世界不同地区数据库获取数据的应用用户的延迟问题。"对于全球使用的应用程序,当你从英国和欧洲访问完全托管在美国的网站或应用程序时,你会看到一些延迟,这仅仅是因为光速是存在的,这些比特在海洋间往返需要一段时间。"

他说,典型客户是大型组织,其中许多在金融服务领域。"我们的大多数客户都是金融服务、政府和其他大型企业,这些应用程序根本不能停机,因此几乎零容忍任何停机时间,结果是他们需要极端水平的高可用性,加上需要能够从一个地理区域故障转移到另一个地理区域以进行灾难恢复保护,"他说。

Gartner的Ronthal表示,分布式PostgreSQL服务可以避免单个云区域的故障。"需要这种程度容错能力的组织在市场中代表相对较小的细分市场。权衡通常围绕核心功能。你获得了内置的分布式处理和事务一致性,但可能放弃了一些其他高级数据库管理系统功能,"他说。

Ronthal表示,如果这些分布式服务实现相同的SQL API,可能是超大型云服务商PostgreSQL服务用户的选择。"真正的问题是这些产品是否提供令人信服的性价比,以及RDS用户是否需要那种程度的高可用性。一些用例需要,一些不需要。RDS是向更强大服务的过渡垫脚石——无论它们是与底层云基础设施紧密集成的服务,如Aurora或AlloyDB,还是提供不同功能的第三方,如分布式SQL数据库供应商。"

针对调查和PostgreSQL服务可靠性的未决问题,AWS表示其PostgreSQL兼容的Amazon Aurora DSQL设计为高达99.999%的可用性,而Amazon Aurora for PostgreSQL提供99.99%的正常运行时间SLA和全球复制,具有不到1分钟的跨区域灾难恢复。发言人表示,AWS提供文档来解释客户在升级期间应该预期的停机时间。

谷歌和微软也就本文提出的问题接受了联系。

来源:The Register

0赞

好文章,需要你的鼓励

2025

07/23

08:26

分享

点赞

邮件订阅