日前,企业级云服务商青云QingCloud宣布推出Kubernetes容器集群管理与编排应用。QingCloud Kubernetes容器服务通过QingCloud AppCenter交付,5分钟内即可完成部署,并与QingCloud IaaS平台深度集成,充分整合SDN(软件定义网络)和SDS(软件定义存储)能力,提供极致的底层性能保障。此外,Kubernetes容器服务完全兼容原生API语法,将用户的学习和迁移成本降至最低。该服务已于QingCloud Insight 2017云计算峰会上正式发布。
Kubernetes容器服务是青云QingCloud基于原生Kubernetes框架提供的容器集群管理与编排应用,用户可以基于它进行容器相关的应用开发、部署、升级,构建CI(持续集成)/CD(持续交付)应用及微服务架构等,并能实现跨机房应用的一致性。用户可以通过QingCloud AppCenter一键部署Kubernetes容器服务,并提供应用全生命周期管理能力(创建、扩容、监控、健康监测等),预置多种工具插件,减轻用户运维工作。
此外,青云QingCloud Kubernetes容器服务还提供以下能力:
青云QingCloud CTO甘泉表示,针对Kubernetes容器服务,QingCloud实现了多重优化,尤其是在网络和存储的性能及平台易用性上,大幅降低了Kubernetes应用的开发和管理门槛,帮助企业应用更便捷地实现微服务化。未来,QingCloud的容器服务将全面支持Mesos、Cloud Foundry、Swarm等主流平台,接驳更多应用类型。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。