vGPUs、边缘与自动化容器成为第17个版本中的核心焦点。
OpenStack的第17个版本已经向我们走来。
这套"Queens"版本发布于3月1日,其中最重要的新功能就是在Nova虚拟化模块当中支持虚拟GPU。
对于OpenStack用户而言,虚拟GPU的加入在一类特定环境当中极具现实意义:即用于管理硬件及软件加速资源的“Cyborg”框架。Cyborg负责处理GPU与其它多种硬件,例如FPGA、CryptoCards或者DPDK/SPDK等快速数据包处理库。
另一项值得关注的补充则为“Zun”,这个全新OpenStack项目负责提供容器服务,旨在通过与Neutron、Cinder、Keystone以及其它核心OpenStack服务相集成以实现容器的快速普及。通过这种方式,OpenStack的原有网络、存储以及身份验证工具将全部适用于容器体系,从而确保容器能够满足安全与合规性要求。
容器用户可能也会爱上新推出的Kuryr CNI守护程序,其允许Kubernetes优先以自动扩展(而无需进行太多K8 API调用)的方式进行微服务规模调整。
Queens版本还提供新的LOCI模块,旨在简化以容器方式部署OpenStack服务的难度。LOCI主要面向边缘计算,其能够对各OpenStack功能进行容器化转换并借此衍生出各类远程计算资源。通过之种方式,运营商(OpenStack项目中的一大关键性用户类别)将能够随时随地添加模块以更有效地使用OpenStack堆栈。
OpenStack还在stackalytics.com 网站上公布了这一最新版本的鸣谢名单。红帽公司在贡献量方面一路领先,紧随其后的则是华为。Nova最受开发者们的青睐。Andreas Jaeger与OpenStack Pike拥有最高的个人贡献量。
OpenStack Queens贡献情况图表。
如果大家在周末没有其它安排,不妨点击此处查看Queens版本的完整发行说明(英文原文)。
OpenStack的下一个版本将被称为“Rocky”,计划于2018年9月发布。另外,在今年5月,Queens版本还将在于温哥华召开的OpenStack峰会上拥有自己的讨论舞台。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。