分析 最新研究显示,客户对超大型云服务商PostgreSQL实例的正常运行时间可靠性表示担忧,这为规模较小的替代供应商提供了填补市场空白的机会。
研究公司Foundry发现,在PostgreSQL常见云服务用户中,82%的用户担心云区域故障,21%的用户在过去一年中经历过此类故障。
在2025年前六个月,数据库流行度排名服务DB-Engines发现PostgreSQL是增长最快的数据库,排名上升超过13个点。它总体排名第四,仅次于Oracle、MySQL和微软SQL Server。2023年,这个开源数据库成为最受开发者欢迎的数据库,这很可能是因为三大领先云服务商的服务使开发者能够轻松使用它。
但上周Foundry对212名来自企业和SaaS业务的IT决策者进行的调查发现,91%当前使用PostgreSQL的组织要求每月停机时间不超过四分钟,即约99.99%的正常运行时间,而24%的组织目标是少于30秒的停机时间。
这项研究由分布式PostgreSQL供应商pgEdge委托进行。Gartner副总裁兼分析师Adam Ronthal表示,目前尚不清楚PostgreSQL服务可靠性SLA是否真的存在问题。"当然,致电Gartner咨询服务的客户目前并没有明确将此认定为问题。"
然而,他呼吁云服务提供商跟踪和记录正常运行时间和可靠性,以消除"传言"并确定特定服务是否确实存在问题。
微软提供Azure Database for PostgreSQL作为完全托管的服务,包括单服务器、灵活服务器和超大规模选项。AWS和谷歌都提供基本的PostgreSQL服务,以及Aurora和AlloyDB等与底层云基础设施更紧密集成的选项。
替代方案的兴起
任何发现这些服务无法满足其正常运行时间需求的用户都有一系列PostgreSQL和PostgreSQL兼容服务可供选择,这些服务具有分布式后端以增强可靠性。例如CockroachDB和YugabyteDB。
与此同时,以基于YouTube开发的分布式关系数据库Vitess的分布式MySQL服务而闻名的PlanetScale,在本月早些时候推出了PostgreSQL服务。
CEO Sam Lambert在接受The Register采访时表示,PlanetScale服务建立在开源PostgreSQL之上,而不是妥协兼容性,并使用该公司为MySQL/Vitess开发的专有操作器。
"操作器是确保PlanetScale具有如此强大的正常运行时间和可靠性的神奇组件:它管理所有节点、状态和拓扑。实际上就是让PostgreSQL适应这个系统,"他说。
Lambert表示,当前服务没有分片,但正在与客户开发分片服务。他说这将是PostgreSQL的"测试等效",但不是100%兼容。"如果有人想使用它,他们应该迁移到非分片服务,我们将努力帮助人们从那里转到分片版本。"
他说YugabyteDB和CockroachDB是"令人印象深刻的"分布式数据库服务,但声称它们没有提供相同程度的PostgreSQL兼容性。"它们甚至没有那么兼容,"他说。
例如,PostgreSQL兼容性指数显示CockroachDB约为40%,而Yugabyte约为85%的兼容性。
Lambert表示,PlanetScale当前的PostgreSQL服务是100%兼容的,而分片服务到达时可能是99%兼容的。
为Web应用开发者提供开源反应式数据库的Convex已经开始从AWS Aurora迁移到PlanetScale。该公司在博客文章中说:"多年来,我们在AWS Aurora之上运行Convex。体验还算可以。Aurora确实做到了宣传的内容:它可靠,扩展性相当好,与AWS其他部分集成得很好。但'可以'不是我们想要停留的地方。"
该公司表示,在已经使用新服务的精选项目上,"性能提升令人难以置信"。
另一家希望利用超大型云服务商PostgreSQL服务可靠性问题和分布式系统兼容性问题的公司是pgEdge,它承诺提供基于开源PostgreSQL构建的多主分布式数据库,允许用户在不同位置拥有多个主数据库。
联合创始人兼CEO Phillip Merrick在接受El Reg采访时表示,这个完全兼容PostgreSQL的服务提供"相当极端水平的高可用性"。
作为副产品,该服务还有助于解决需要从世界不同地区数据库获取数据的应用用户的延迟问题。"对于全球使用的应用程序,当你从英国和欧洲访问完全托管在美国的网站或应用程序时,你会看到一些延迟,这仅仅是因为光速是存在的,这些比特在海洋间往返需要一段时间。"
他说,典型客户是大型组织,其中许多在金融服务领域。"我们的大多数客户都是金融服务、政府和其他大型企业,这些应用程序根本不能停机,因此几乎零容忍任何停机时间,结果是他们需要极端水平的高可用性,加上需要能够从一个地理区域故障转移到另一个地理区域以进行灾难恢复保护,"他说。
Gartner的Ronthal表示,分布式PostgreSQL服务可以避免单个云区域的故障。"需要这种程度容错能力的组织在市场中代表相对较小的细分市场。权衡通常围绕核心功能。你获得了内置的分布式处理和事务一致性,但可能放弃了一些其他高级数据库管理系统功能,"他说。
Ronthal表示,如果这些分布式服务实现相同的SQL API,可能是超大型云服务商PostgreSQL服务用户的选择。"真正的问题是这些产品是否提供令人信服的性价比,以及RDS用户是否需要那种程度的高可用性。一些用例需要,一些不需要。RDS是向更强大服务的过渡垫脚石——无论它们是与底层云基础设施紧密集成的服务,如Aurora或AlloyDB,还是提供不同功能的第三方,如分布式SQL数据库供应商。"
针对调查和PostgreSQL服务可靠性的未决问题,AWS表示其PostgreSQL兼容的Amazon Aurora DSQL设计为高达99.999%的可用性,而Amazon Aurora for PostgreSQL提供99.99%的正常运行时间SLA和全球复制,具有不到1分钟的跨区域灾难恢复。发言人表示,AWS提供文档来解释客户在升级期间应该预期的停机时间。
谷歌和微软也就本文提出的问题接受了联系。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。