近日,为了更好地满足客户在AI业务场景下的需要,UCloud优刻得镜像市场上线支持了Milvus向量数据库镜像。
随着时代发展,文档资料、图片、语音、视频影像等非结构化数据开始海量涌现。为了能够更好地使用这些数据,可以使用embedding将它们转换为向量,并将这些向量存储到向量数据库中,建立索引方便检索。检索时通过计算两个向量的相似度来分析它们之间的相关性。如果两个向量非常相似,则表示原始数据源也非常相似,从而找到目标数据。
利用这样的存储和检索的能力,在大语言模型(LLM)的技术架构中,向量数据库可以作为一个持久性的记忆体,满足对私有知识库文档和数据的存储管理、保存大模型的处理结果、保存AI智能体产生的新知识和交互上下文等需求,并在模型需要时随时快速调用,提高模型结果输出的准确性和效率。
此次UCloud镜像市场新增支持的Milvus,正是一款在Github上拥有两万多星的开源向量数据库,专门为向量的快速查询检索而设计,能够对万亿规模的向量数据创建索引。Milvus具备高性能、高可扩展性等特点,数据可持久化存储在本地或者支持s3协议的对象存储,且支持数据分区;除了向量,Milvus还支持布尔值、整数、浮点数等数据类型,可以更好地存储表达业务数据的特性;Milvus还将标量过滤和向量相似度搜索相结合,支持混合查询的能力;同时,Milvus还支持多种开发语言SDK,有丰富的周边配套工具。
目前UCloud镜像市场提供的Milvus向量数据库是Standalone版本,只需4个步骤,即可通过云主机镜像快速获得向量数据库能力。
1、登录UCloud控制台
(https://console.ucloud.cn/uhost/uhost/create)
2、选择快杰O型云主机,推荐配置8核CPU、16G内存、系统盘不低于100G
3、在镜像市场选择“向量数据库Milvus”镜像
4、立即创建,开机后系统将自动启动Milvus向量数据库。同时,云主机内还预装了milvus_cli客户端工具,可以直接访问
连接访问Milvus以及数据操作的更多使用细节可参考官方文档:
https://milvus.io/docs/manage_connection.md
如若向量数据库所需要的CPU/内存/硬盘需要扩展,可以通过云主机的改配功能,数秒内即可完成升级。
UCloud优刻得在云主机镜像市场中发布的向量数据库镜像,旨在为AI业务场景的客户提供技术架构中所需要的一个重要拼图,尤其是在图片/语音/视频检索、文本检索、NLP语言问答等业务场景中,向量数据库可以很好的应用。同时,该向量数据库还可以与不久前镜像市场发布的大模型镜像相结合,形成更完整的解决方案,满足业务技术架构需要。
好文章,需要你的鼓励
新创公司Germ为Bluesky社交网络推出端到端加密消息服务,为用户提供比现有私信更安全的聊天选项。经过两年开发,该服务本周进入测试阶段,计划逐步扩大测试用户规模。Germ采用新兴技术如消息层安全协议和AT协议,无需手机号码即可实现安全通信。用户可通过"魔法链接"快速开始聊天,利用苹果App Clips技术无需下载完整应用。
这项研究由哈佛大学团队开发的创新框架,解决了多机构数据共享的核心难题。他们巧妙结合联邦学习、局部差分隐私和公平性约束,使不同机构能在保护数据隐私的同时协作开发更准确、更公平的决策模型。实验证明,该方法在多个真实数据集上既保障了隐私,又显著提升了模型公平性,为医疗、金融和政府等领域的数据协作提供了实用解决方案。
高通公司宣布正在与领先的超大规模云服务商进行深度合作谈判,开发专用于数据中心的CPU产品。CEO阿蒙表示,公司正在开发通用CPU和推理集群产品,预计2028财年开始产生收入。同时,高通面临三星在高端智能手机市场的竞争压力,三星计划在2026年推出采用2纳米工艺的新款Exynos处理器。高通Q3财报显示营收增长10%至103.5亿美元,净利润增长25%。
Meta AI研究团队开发的ALOHA系统是一种低成本开源的双臂机器人远程操作平台,旨在使机器人学习更加民主化和普及化。该系统结合了价格亲民的硬件设计和先进的行为克隆学习算法,使机器人能够从人类示范中学习复杂技能。研究表明,ALOHA系统展示了强大的泛化能力,能够在新环境中应用所学技能,如打开不同类型的瓶子。系统的开源性质鼓励全球研究者参与并推动机器人学习领域的发展,尽管仍面临成本和精确力控制等挑战。