Xen项目上周发布了(https://lists.xenproject.org/archives/html/xen- devel/2018-01/msg00333.html)Xen 4.11第一个候选版本,候选版的发布日期离测试版发布日2018年6月1日还有几个星期。
为了帮助读者了解6月1日的发布内容,记者就下一个版本的重要新内容询问了Xen项目顾问委员会主席Lars Kurth的看法。
他给出了以下的答复。
“我们最近几个版本的长期发展主题之一就是要让用户能够从xen代码库编译出大量功能。在这个版本里,我们添加了两种主要用例的所有功能块,两种用例以不同的方式突显了这些功能,但是我们还未有将此功能提供给编译代码。两个用例都依赖于嵌套虚拟化,即是说,使用PV (半虚拟化)功能的访客用户可以在HVM( 硬件虚拟机)容器里运行,反之亦然。”
为实现这一计划,Xen 4.11增加了Kurth称之为“名为PVShim的新功能”。他表示,“PVShim在2017年7月的开发者峰会上曾首次被详细讨论过。此功能最初是作为Meltdown的一种缓解措施发布的,但却是4.11的关键功能。 PVShim允许“经典”的仅限PV访客在PVH模式下运行(PVH指 具有CPU虚拟化扩展的半虚拟化)。云提供商利用此功能可支持旧的仅限PV发行版,同时仅提供一种类型的访客。这样可简化管理并显着减小攻击面,可允许最终用户构建Xen虚拟机管理程序配置,无需“经典”PV的支持。”
他还指,另外,开发人员在新版本上 “花费大量时间完成及优化Meltdown和Specter漏洞的缓解措施。我们构建了性能优化的XPTI,XPTI相当于Xen里的 KPTI。值得注意的是,只有'经典PV'访客需要XPTI,HVM和PVH访客是不容易受到Meltdown影响的。“
Kurth还表示,“第二种使用案例用了更强大的虚拟化隔离保证,可启动构建类似容器的功能。在这种情况下,用户可构建仅限PV的Xen(不支持HVM或PVH),具有那些在Xen 4.9和4.10里引入的PVCalls和9pfs支持。用户不是在Linux容器中运行容器映像,而是在PV访客里运行容器映像,提供了非常好的隔离。这个新的小型Xen配置目前还没有名字,这种Xen配置可以直接在主机上运行,或是部署到HVM或PVH云实例中,可利用Xen独特的功能在现有云提供商上运行,无需特殊嵌套虚拟化的支持。”
Kurth最后表示,“还会有很多的改进,但是上面列出的各项令团队倍感振奋。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。