近日,为了更好地满足客户在AI业务场景下的需要,UCloud优刻得镜像市场上线支持了Milvus向量数据库镜像。
随着时代发展,文档资料、图片、语音、视频影像等非结构化数据开始海量涌现。为了能够更好地使用这些数据,可以使用embedding将它们转换为向量,并将这些向量存储到向量数据库中,建立索引方便检索。检索时通过计算两个向量的相似度来分析它们之间的相关性。如果两个向量非常相似,则表示原始数据源也非常相似,从而找到目标数据。
利用这样的存储和检索的能力,在大语言模型(LLM)的技术架构中,向量数据库可以作为一个持久性的记忆体,满足对私有知识库文档和数据的存储管理、保存大模型的处理结果、保存AI智能体产生的新知识和交互上下文等需求,并在模型需要时随时快速调用,提高模型结果输出的准确性和效率。
此次UCloud镜像市场新增支持的Milvus,正是一款在Github上拥有两万多星的开源向量数据库,专门为向量的快速查询检索而设计,能够对万亿规模的向量数据创建索引。Milvus具备高性能、高可扩展性等特点,数据可持久化存储在本地或者支持s3协议的对象存储,且支持数据分区;除了向量,Milvus还支持布尔值、整数、浮点数等数据类型,可以更好地存储表达业务数据的特性;Milvus还将标量过滤和向量相似度搜索相结合,支持混合查询的能力;同时,Milvus还支持多种开发语言SDK,有丰富的周边配套工具。
目前UCloud镜像市场提供的Milvus向量数据库是Standalone版本,只需4个步骤,即可通过云主机镜像快速获得向量数据库能力。
1、登录UCloud控制台
(https://console.ucloud.cn/uhost/uhost/create)
2、选择快杰O型云主机,推荐配置8核CPU、16G内存、系统盘不低于100G
3、在镜像市场选择“向量数据库Milvus”镜像
4、立即创建,开机后系统将自动启动Milvus向量数据库。同时,云主机内还预装了milvus_cli客户端工具,可以直接访问
连接访问Milvus以及数据操作的更多使用细节可参考官方文档:
https://milvus.io/docs/manage_connection.md
如若向量数据库所需要的CPU/内存/硬盘需要扩展,可以通过云主机的改配功能,数秒内即可完成升级。
UCloud优刻得在云主机镜像市场中发布的向量数据库镜像,旨在为AI业务场景的客户提供技术架构中所需要的一个重要拼图,尤其是在图片/语音/视频检索、文本检索、NLP语言问答等业务场景中,向量数据库可以很好的应用。同时,该向量数据库还可以与不久前镜像市场发布的大模型镜像相结合,形成更完整的解决方案,满足业务技术架构需要。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。