ScyllaDB是一款被康卡斯特、三星和桑坦德银行等知名企业使用的宽列数据库,该公司近日发布了一项新的数据库服务,声称能够显著改善可扩展性并降低成本。
该公司最近还修改了其许可条款,从GNU通用公共许可证(AGPL)转向源码可用许可证。据公司CEO表示,ScyllaDB 6.2将是AGPL许可证下的最终版本,此举旨在解决"核心产品为开源的供应商面临的持续挑战"。
ScyllaDB于2019年首次推出基于vnode数据复制的数据库即服务(DBaaS),该技术源自另一款用于低延迟全球分布式应用的宽列数据库Cassandra。新服务名为ScyllaDB X,采用Raft共识算法引入了全新的tablets架构。
首席技术官Avi Kivity在博客文章中表示:"Tablets架构旨在支持集群间灵活动态的数据分布。基于Raft算法,这种新方法提供了全新级别的弹性,具备近乎即时的引导能力,甚至能够并行添加新节点——一次性将整个集群规模翻倍。"
"由于新节点在加入集群后立即开始处理请求,用户可以启动新节点并几乎即时开始服务请求。这意味着团队能够快速扩展以应对流量高峰——在满足延迟服务级别协议的同时,无需进行'以防万一'的过度配置。"
ScyllaDB声称新系统能够在几分钟内从10万OPS扩展到200万OPS,同时保持稳定的个位数毫秒延迟,并相比同类系统降低成本。
该公司在1月宣布许可证变更,表示首个源码可用产品ScyllaDB Enterprise 2025.1将于4月发布。
联合创始人兼CEO Dor Laor当时表示,尽管团队为数十个开源项目贡献了代码,包括驱动程序、Kubernetes操作器、测试工具和各种工具,但维护主产品的两个代码库存在困难。
"近十年来,我们一直维护着两个独立的发布流:一个用于开源数据库,另一个用于企业产品。平衡免费与付费产品是一个永无止境的挑战,涉及工程、产品、营销和持续的销售讨论,"他说道。
ScyllaDB声称其竞争对手Apache Cassandra的性能不可预测且缓慢,这促使用户迁移到其系统。然而,要想取得进展,它必须克服Cassandra市场渗透率的顽固性。
与ScyllaDB类似,Cassandra设计用于支持写入操作多于读取操作的高度分布式系统,所谓的ACID合规性并不重要。例如,Netflix自2013年起一直使用Cassandra,替换Oracle数据库并使用这一NoSQL系统支持全球账户和客户数据。苹果是另一个Cassandra的旗舰用户。
今年2月,IBM收购了支持并贡献Cassandra的AI和数据公司DataStax,Cassandra仍然是Apache项目。
当时,IBM表示打算让DataStax继续与Apache Cassandra、Langflow、Apache Pulsar和OpenSearch等开源社区合作。
IBM计划将DataStax的Cassandra数据库服务AstraDB用于改善IBM watsonx.data(IBM用于AI和分析的数据湖)现有的向量功能。IBM还认为Langflow这一用于构建AI应用的开源可视化框架将为IBM watsonx.ai(其AI开发工作室)增加中间件功能。
好文章,需要你的鼓励
推理模型存在崩溃缺陷?Open Philanthropy研究人员提出AI推理能力评估的改进方法
浙江大学团队提出CanDist框架,让AI在数据标注时先提供多个候选答案而非单一答案,再通过师生框架筛选最优标签。该方法受心理学"模糊厌恶"启发,在六个文本分类任务上表现优异,相比传统方法平均提升18-27%准确率,为AI数据标注提供了更智能可靠的解决方案。
职场正在经历一场悄然的变革。最新盖洛普研究显示,虽然算法工具越来越普及,27%的员工经常使用AI工具,但员工对与AI系统协作的准备度却在下降。欧盟AI法案强调透明度,要求用户了解何时与AI交互。研究提出"双重素养"概念,即同时具备人类和算法领域的流利度。成功的人机协作需要信任校准,在过度依赖和充分利用AI能力之间找到平衡。组织文化需要培养好奇心、同理心、创造力和勇气四种品质,以实现有意识的人机协作。
微软联合多所知名高校开发了SwS框架,让AI模型能够自主识别学习弱点并生成针对性练习题进行自我改进。该方法在数学推理任务上取得显著效果,7B和32B模型平均性能分别提升10%和7.7%。通过"弱点诊断-针对性出题-强化训练"的三步流程,AI首次实现了真正意义上的自我反思式学习,不依赖外部知识灌输即可持续优化自身能力,为人工智能的自主学习开辟了新道路。