近日,为了更好地满足客户在AI业务场景下的需要,UCloud优刻得镜像市场上线支持了Milvus向量数据库镜像。
随着时代发展,文档资料、图片、语音、视频影像等非结构化数据开始海量涌现。为了能够更好地使用这些数据,可以使用embedding将它们转换为向量,并将这些向量存储到向量数据库中,建立索引方便检索。检索时通过计算两个向量的相似度来分析它们之间的相关性。如果两个向量非常相似,则表示原始数据源也非常相似,从而找到目标数据。
利用这样的存储和检索的能力,在大语言模型(LLM)的技术架构中,向量数据库可以作为一个持久性的记忆体,满足对私有知识库文档和数据的存储管理、保存大模型的处理结果、保存AI智能体产生的新知识和交互上下文等需求,并在模型需要时随时快速调用,提高模型结果输出的准确性和效率。
此次UCloud镜像市场新增支持的Milvus,正是一款在Github上拥有两万多星的开源向量数据库,专门为向量的快速查询检索而设计,能够对万亿规模的向量数据创建索引。Milvus具备高性能、高可扩展性等特点,数据可持久化存储在本地或者支持s3协议的对象存储,且支持数据分区;除了向量,Milvus还支持布尔值、整数、浮点数等数据类型,可以更好地存储表达业务数据的特性;Milvus还将标量过滤和向量相似度搜索相结合,支持混合查询的能力;同时,Milvus还支持多种开发语言SDK,有丰富的周边配套工具。
目前UCloud镜像市场提供的Milvus向量数据库是Standalone版本,只需4个步骤,即可通过云主机镜像快速获得向量数据库能力。
1、登录UCloud控制台
(https://console.ucloud.cn/uhost/uhost/create)
2、选择快杰O型云主机,推荐配置8核CPU、16G内存、系统盘不低于100G
3、在镜像市场选择“向量数据库Milvus”镜像
4、立即创建,开机后系统将自动启动Milvus向量数据库。同时,云主机内还预装了milvus_cli客户端工具,可以直接访问

连接访问Milvus以及数据操作的更多使用细节可参考官方文档:
https://milvus.io/docs/manage_connection.md

如若向量数据库所需要的CPU/内存/硬盘需要扩展,可以通过云主机的改配功能,数秒内即可完成升级。
UCloud优刻得在云主机镜像市场中发布的向量数据库镜像,旨在为AI业务场景的客户提供技术架构中所需要的一个重要拼图,尤其是在图片/语音/视频检索、文本检索、NLP语言问答等业务场景中,向量数据库可以很好的应用。同时,该向量数据库还可以与不久前镜像市场发布的大模型镜像相结合,形成更完整的解决方案,满足业务技术架构需要。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。