ScyllaDB是一款被康卡斯特、三星和桑坦德银行等知名企业使用的宽列数据库,该公司近日发布了一项新的数据库服务,声称能够显著改善可扩展性并降低成本。
该公司最近还修改了其许可条款,从GNU通用公共许可证(AGPL)转向源码可用许可证。据公司CEO表示,ScyllaDB 6.2将是AGPL许可证下的最终版本,此举旨在解决"核心产品为开源的供应商面临的持续挑战"。
ScyllaDB于2019年首次推出基于vnode数据复制的数据库即服务(DBaaS),该技术源自另一款用于低延迟全球分布式应用的宽列数据库Cassandra。新服务名为ScyllaDB X,采用Raft共识算法引入了全新的tablets架构。
首席技术官Avi Kivity在博客文章中表示:"Tablets架构旨在支持集群间灵活动态的数据分布。基于Raft算法,这种新方法提供了全新级别的弹性,具备近乎即时的引导能力,甚至能够并行添加新节点——一次性将整个集群规模翻倍。"
"由于新节点在加入集群后立即开始处理请求,用户可以启动新节点并几乎即时开始服务请求。这意味着团队能够快速扩展以应对流量高峰——在满足延迟服务级别协议的同时,无需进行'以防万一'的过度配置。"
ScyllaDB声称新系统能够在几分钟内从10万OPS扩展到200万OPS,同时保持稳定的个位数毫秒延迟,并相比同类系统降低成本。
该公司在1月宣布许可证变更,表示首个源码可用产品ScyllaDB Enterprise 2025.1将于4月发布。
联合创始人兼CEO Dor Laor当时表示,尽管团队为数十个开源项目贡献了代码,包括驱动程序、Kubernetes操作器、测试工具和各种工具,但维护主产品的两个代码库存在困难。
"近十年来,我们一直维护着两个独立的发布流:一个用于开源数据库,另一个用于企业产品。平衡免费与付费产品是一个永无止境的挑战,涉及工程、产品、营销和持续的销售讨论,"他说道。
ScyllaDB声称其竞争对手Apache Cassandra的性能不可预测且缓慢,这促使用户迁移到其系统。然而,要想取得进展,它必须克服Cassandra市场渗透率的顽固性。
与ScyllaDB类似,Cassandra设计用于支持写入操作多于读取操作的高度分布式系统,所谓的ACID合规性并不重要。例如,Netflix自2013年起一直使用Cassandra,替换Oracle数据库并使用这一NoSQL系统支持全球账户和客户数据。苹果是另一个Cassandra的旗舰用户。
今年2月,IBM收购了支持并贡献Cassandra的AI和数据公司DataStax,Cassandra仍然是Apache项目。
当时,IBM表示打算让DataStax继续与Apache Cassandra、Langflow、Apache Pulsar和OpenSearch等开源社区合作。
IBM计划将DataStax的Cassandra数据库服务AstraDB用于改善IBM watsonx.data(IBM用于AI和分析的数据湖)现有的向量功能。IBM还认为Langflow这一用于构建AI应用的开源可视化框架将为IBM watsonx.ai(其AI开发工作室)增加中间件功能。
好文章,需要你的鼓励
来自上海交通大学和浙江大学等机构的研究团队开发出首个AI"记忆操作系统"MemOS,解决了AI系统无法实现人类般持久记忆和学习的根本限制。该系统将记忆视为核心计算资源进行调度、共享和演化,在时间推理任务中相比OpenAI记忆系统性能提升159%。MemOS采用三层架构设计,通过标准化记忆单元实现跨平台记忆迁移,有望改变企业AI部署模式。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。