ScyllaDB是一款被康卡斯特、三星和桑坦德银行等知名企业使用的宽列数据库,该公司近日发布了一项新的数据库服务,声称能够显著改善可扩展性并降低成本。
该公司最近还修改了其许可条款,从GNU通用公共许可证(AGPL)转向源码可用许可证。据公司CEO表示,ScyllaDB 6.2将是AGPL许可证下的最终版本,此举旨在解决"核心产品为开源的供应商面临的持续挑战"。
ScyllaDB于2019年首次推出基于vnode数据复制的数据库即服务(DBaaS),该技术源自另一款用于低延迟全球分布式应用的宽列数据库Cassandra。新服务名为ScyllaDB X,采用Raft共识算法引入了全新的tablets架构。
首席技术官Avi Kivity在博客文章中表示:"Tablets架构旨在支持集群间灵活动态的数据分布。基于Raft算法,这种新方法提供了全新级别的弹性,具备近乎即时的引导能力,甚至能够并行添加新节点——一次性将整个集群规模翻倍。"
"由于新节点在加入集群后立即开始处理请求,用户可以启动新节点并几乎即时开始服务请求。这意味着团队能够快速扩展以应对流量高峰——在满足延迟服务级别协议的同时,无需进行'以防万一'的过度配置。"
ScyllaDB声称新系统能够在几分钟内从10万OPS扩展到200万OPS,同时保持稳定的个位数毫秒延迟,并相比同类系统降低成本。
该公司在1月宣布许可证变更,表示首个源码可用产品ScyllaDB Enterprise 2025.1将于4月发布。
联合创始人兼CEO Dor Laor当时表示,尽管团队为数十个开源项目贡献了代码,包括驱动程序、Kubernetes操作器、测试工具和各种工具,但维护主产品的两个代码库存在困难。
"近十年来,我们一直维护着两个独立的发布流:一个用于开源数据库,另一个用于企业产品。平衡免费与付费产品是一个永无止境的挑战,涉及工程、产品、营销和持续的销售讨论,"他说道。
ScyllaDB声称其竞争对手Apache Cassandra的性能不可预测且缓慢,这促使用户迁移到其系统。然而,要想取得进展,它必须克服Cassandra市场渗透率的顽固性。
与ScyllaDB类似,Cassandra设计用于支持写入操作多于读取操作的高度分布式系统,所谓的ACID合规性并不重要。例如,Netflix自2013年起一直使用Cassandra,替换Oracle数据库并使用这一NoSQL系统支持全球账户和客户数据。苹果是另一个Cassandra的旗舰用户。
今年2月,IBM收购了支持并贡献Cassandra的AI和数据公司DataStax,Cassandra仍然是Apache项目。
当时,IBM表示打算让DataStax继续与Apache Cassandra、Langflow、Apache Pulsar和OpenSearch等开源社区合作。
IBM计划将DataStax的Cassandra数据库服务AstraDB用于改善IBM watsonx.data(IBM用于AI和分析的数据湖)现有的向量功能。IBM还认为Langflow这一用于构建AI应用的开源可视化框架将为IBM watsonx.ai(其AI开发工作室)增加中间件功能。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。