分析 最新研究显示,客户对超大型云服务商PostgreSQL实例的正常运行时间可靠性表示担忧,这为规模较小的替代供应商提供了填补市场空白的机会。
研究公司Foundry发现,在PostgreSQL常见云服务用户中,82%的用户担心云区域故障,21%的用户在过去一年中经历过此类故障。
在2025年前六个月,数据库流行度排名服务DB-Engines发现PostgreSQL是增长最快的数据库,排名上升超过13个点。它总体排名第四,仅次于Oracle、MySQL和微软SQL Server。2023年,这个开源数据库成为最受开发者欢迎的数据库,这很可能是因为三大领先云服务商的服务使开发者能够轻松使用它。
但上周Foundry对212名来自企业和SaaS业务的IT决策者进行的调查发现,91%当前使用PostgreSQL的组织要求每月停机时间不超过四分钟,即约99.99%的正常运行时间,而24%的组织目标是少于30秒的停机时间。
这项研究由分布式PostgreSQL供应商pgEdge委托进行。Gartner副总裁兼分析师Adam Ronthal表示,目前尚不清楚PostgreSQL服务可靠性SLA是否真的存在问题。"当然,致电Gartner咨询服务的客户目前并没有明确将此认定为问题。"
然而,他呼吁云服务提供商跟踪和记录正常运行时间和可靠性,以消除"传言"并确定特定服务是否确实存在问题。
微软提供Azure Database for PostgreSQL作为完全托管的服务,包括单服务器、灵活服务器和超大规模选项。AWS和谷歌都提供基本的PostgreSQL服务,以及Aurora和AlloyDB等与底层云基础设施更紧密集成的选项。
替代方案的兴起
任何发现这些服务无法满足其正常运行时间需求的用户都有一系列PostgreSQL和PostgreSQL兼容服务可供选择,这些服务具有分布式后端以增强可靠性。例如CockroachDB和YugabyteDB。
与此同时,以基于YouTube开发的分布式关系数据库Vitess的分布式MySQL服务而闻名的PlanetScale,在本月早些时候推出了PostgreSQL服务。
CEO Sam Lambert在接受The Register采访时表示,PlanetScale服务建立在开源PostgreSQL之上,而不是妥协兼容性,并使用该公司为MySQL/Vitess开发的专有操作器。
"操作器是确保PlanetScale具有如此强大的正常运行时间和可靠性的神奇组件:它管理所有节点、状态和拓扑。实际上就是让PostgreSQL适应这个系统,"他说。
Lambert表示,当前服务没有分片,但正在与客户开发分片服务。他说这将是PostgreSQL的"测试等效",但不是100%兼容。"如果有人想使用它,他们应该迁移到非分片服务,我们将努力帮助人们从那里转到分片版本。"
他说YugabyteDB和CockroachDB是"令人印象深刻的"分布式数据库服务,但声称它们没有提供相同程度的PostgreSQL兼容性。"它们甚至没有那么兼容,"他说。
例如,PostgreSQL兼容性指数显示CockroachDB约为40%,而Yugabyte约为85%的兼容性。
Lambert表示,PlanetScale当前的PostgreSQL服务是100%兼容的,而分片服务到达时可能是99%兼容的。
为Web应用开发者提供开源反应式数据库的Convex已经开始从AWS Aurora迁移到PlanetScale。该公司在博客文章中说:"多年来,我们在AWS Aurora之上运行Convex。体验还算可以。Aurora确实做到了宣传的内容:它可靠,扩展性相当好,与AWS其他部分集成得很好。但'可以'不是我们想要停留的地方。"
该公司表示,在已经使用新服务的精选项目上,"性能提升令人难以置信"。
另一家希望利用超大型云服务商PostgreSQL服务可靠性问题和分布式系统兼容性问题的公司是pgEdge,它承诺提供基于开源PostgreSQL构建的多主分布式数据库,允许用户在不同位置拥有多个主数据库。
联合创始人兼CEO Phillip Merrick在接受El Reg采访时表示,这个完全兼容PostgreSQL的服务提供"相当极端水平的高可用性"。
作为副产品,该服务还有助于解决需要从世界不同地区数据库获取数据的应用用户的延迟问题。"对于全球使用的应用程序,当你从英国和欧洲访问完全托管在美国的网站或应用程序时,你会看到一些延迟,这仅仅是因为光速是存在的,这些比特在海洋间往返需要一段时间。"
他说,典型客户是大型组织,其中许多在金融服务领域。"我们的大多数客户都是金融服务、政府和其他大型企业,这些应用程序根本不能停机,因此几乎零容忍任何停机时间,结果是他们需要极端水平的高可用性,加上需要能够从一个地理区域故障转移到另一个地理区域以进行灾难恢复保护,"他说。
Gartner的Ronthal表示,分布式PostgreSQL服务可以避免单个云区域的故障。"需要这种程度容错能力的组织在市场中代表相对较小的细分市场。权衡通常围绕核心功能。你获得了内置的分布式处理和事务一致性,但可能放弃了一些其他高级数据库管理系统功能,"他说。
Ronthal表示,如果这些分布式服务实现相同的SQL API,可能是超大型云服务商PostgreSQL服务用户的选择。"真正的问题是这些产品是否提供令人信服的性价比,以及RDS用户是否需要那种程度的高可用性。一些用例需要,一些不需要。RDS是向更强大服务的过渡垫脚石——无论它们是与底层云基础设施紧密集成的服务,如Aurora或AlloyDB,还是提供不同功能的第三方,如分布式SQL数据库供应商。"
针对调查和PostgreSQL服务可靠性的未决问题,AWS表示其PostgreSQL兼容的Amazon Aurora DSQL设计为高达99.999%的可用性,而Amazon Aurora for PostgreSQL提供99.99%的正常运行时间SLA和全球复制,具有不到1分钟的跨区域灾难恢复。发言人表示,AWS提供文档来解释客户在升级期间应该预期的停机时间。
谷歌和微软也就本文提出的问题接受了联系。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。