近日,为了更好地满足客户在AI业务场景下的需要,UCloud优刻得镜像市场上线支持了Milvus向量数据库镜像。
随着时代发展,文档资料、图片、语音、视频影像等非结构化数据开始海量涌现。为了能够更好地使用这些数据,可以使用embedding将它们转换为向量,并将这些向量存储到向量数据库中,建立索引方便检索。检索时通过计算两个向量的相似度来分析它们之间的相关性。如果两个向量非常相似,则表示原始数据源也非常相似,从而找到目标数据。
利用这样的存储和检索的能力,在大语言模型(LLM)的技术架构中,向量数据库可以作为一个持久性的记忆体,满足对私有知识库文档和数据的存储管理、保存大模型的处理结果、保存AI智能体产生的新知识和交互上下文等需求,并在模型需要时随时快速调用,提高模型结果输出的准确性和效率。
此次UCloud镜像市场新增支持的Milvus,正是一款在Github上拥有两万多星的开源向量数据库,专门为向量的快速查询检索而设计,能够对万亿规模的向量数据创建索引。Milvus具备高性能、高可扩展性等特点,数据可持久化存储在本地或者支持s3协议的对象存储,且支持数据分区;除了向量,Milvus还支持布尔值、整数、浮点数等数据类型,可以更好地存储表达业务数据的特性;Milvus还将标量过滤和向量相似度搜索相结合,支持混合查询的能力;同时,Milvus还支持多种开发语言SDK,有丰富的周边配套工具。
目前UCloud镜像市场提供的Milvus向量数据库是Standalone版本,只需4个步骤,即可通过云主机镜像快速获得向量数据库能力。
1、登录UCloud控制台
(https://console.ucloud.cn/uhost/uhost/create)
2、选择快杰O型云主机,推荐配置8核CPU、16G内存、系统盘不低于100G
3、在镜像市场选择“向量数据库Milvus”镜像
4、立即创建,开机后系统将自动启动Milvus向量数据库。同时,云主机内还预装了milvus_cli客户端工具,可以直接访问
连接访问Milvus以及数据操作的更多使用细节可参考官方文档:
https://milvus.io/docs/manage_connection.md
如若向量数据库所需要的CPU/内存/硬盘需要扩展,可以通过云主机的改配功能,数秒内即可完成升级。
UCloud优刻得在云主机镜像市场中发布的向量数据库镜像,旨在为AI业务场景的客户提供技术架构中所需要的一个重要拼图,尤其是在图片/语音/视频检索、文本检索、NLP语言问答等业务场景中,向量数据库可以很好的应用。同时,该向量数据库还可以与不久前镜像市场发布的大模型镜像相结合,形成更完整的解决方案,满足业务技术架构需要。
好文章,需要你的鼓励
铠侠正在测试最新的UFS v4.1嵌入式闪存芯片,专为智能手机和平板电脑设计,可提供更快的下载速度和更流畅的设备端AI应用性能。该芯片采用218层TLC 3D NAND技术,提供256GB、512GB和1TB容量选择。相比v4.0产品,随机写入性能提升约30%,随机读取性能提升35-45%,同时功耗效率改善15-20%。新标准还增加了主机发起碎片整理、增强异常处理等功能特性。
上海AI实验室团队提出创新的异步拍摄方案,仅用普通相机就能实现高速4D重建。该方法通过错开相机启动时间将有效帧率从25FPS提升至100-200FPS,并结合视频扩散模型修复稀疏视角导致的重建伪影。实验结果显示,新方法在处理快速运动场景时显著优于现有技术,为低成本高质量4D内容创作开辟新路径。
谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。
上海AI实验室联手复旦大学提出了POLAR方法,这是一种革命性的奖励模型训练技术。通过让AI学会识别不同策略间的差异而非死记评分标准,POLAR在多项任务上实现了显著提升,7B参数模型超越72B现有最强基线,为AI对齐问题提供了全新解决思路。