9月5日,浪潮云海InCloud OpenStack 5.6(ICOS 5.6)成功完成单一集群规模达500节点的测试,这是目前基于OpenStack Rocky版本进行的单一集群全球最大规模实践。同时,中国信息通信研究院对本次测试予以全程跟踪,这将有望推动OpenStack在大规模单一集群领域建立起科学评估的参考基线。

浪潮集团副总裁张东表示,Rocky是OpenStack基金会非常重视的一个版本,但从发布到现在只有一年的时间,用户对其在生产环境特别是单一集群规模化部署中的表现欠缺了解,可能会因为种种顾虑而推迟部署或升级计划。“我们希望通过这样一次测试,一方面验证基于Rocky的浪潮ICOS 5.6在大规模单一集群云环境下的性能表现,另一方面通过详细测试数据的分享加深用户对Rocky的了解,为他们部署OpenStack私有云提供重要的参考依据。”
此前,浪潮云海ICOS已具备单集群设计规格超1000节点能力,并已在广电等客户中成功部署了单集群1000+节点的大型行业云。本次测试重点围绕在大规模单一集群云环境下,ICOS 5.6在高可用、高性能和高效率方面的表现。
测试结果显示,在高密度、高并发环境测试中,在系统已有20000虚拟机负载情况下,成功完成负载60%环境下的1000并发虚拟机创建,空载环境下2000并发虚拟机创建。同时,测试验证了大规模集群在极端情况下的高可用,模拟了整机柜断电这种现实场景中较为严重的情况,在单个机柜负载180虚拟机环境下,实现了5分钟内疏散完毕,访问恢复正常。在高性能方面,本次测试结合客户实际应用场景中反馈的对网络低延迟、低抖动的要求,专门从硬件层、操作系统层到ICOS层做了全栈的优化,最终实现了48小时内时统丢包小于10的-7次方,组播丢包率为0,能够满足对实时通信有苛刻要求的用户需求。
此外,浪潮云海ICOS 5.6在云平台软环境部署交付效率上也有上佳表现,10小时完成500台服务器节点系统部署、5小时部署323个OpenStack节点、3小时部署77个分布式存储节点、1小时完成100个计算节点扩容改配,单日可交付500+节点。
当下,云与AI、大数据、物联网、5G、边缘计算等多技术融合,虚拟机与容器、裸机等多架构并存,对云平台的兼容性、可靠性、可用性和管理带来更大挑战。
OpenStack作为事实上的开源云计算标准,在技术兼容性上具备先天优势,由此也受到大型企业用户的青睐。来自OpenStack社区最新的《2018 OpenStack用户调查报告》显示,OpenStack在万人以上规模公司的部署率达到21%。可以说,大型用户已经成为OpenStack在商业领域的重要参与者和推动者。
不过,在大型用户的OpenStack实践中,普遍面临的问题是随着内外部用户数量的增长,单一应用和服务的规模变得愈发庞大,可能需要同时部署数百甚至数千台虚拟机。如果使用多个小规模集群构建云平台,应用和服务的跨集群部署、管理、升级会变得异常困难甚至无法实现,因此对单一集群的规模产生了更强烈的需求。
浪潮集团副总裁张东认为,“单一集群规模提升带来的好处显而易见,它能够实现更高、更灵活的工作负载,提升云平台的伸缩性并显著降低管理复杂度。浪潮希望通过在OpenStack单一集群部署规模上的不断突破,来帮助大型企业用户构建简单、高速、高可扩展的开源云基础设施,以支撑快速、灵活和大规模的业务创新与部署。”
目前 ,浪潮已成功实施了数个1000+节点的OpenStack行业云,在大规模集群部署能力上全球领先。基于浪潮云海平台核心产品InCloud Manager、InCloud OpenStack、InCloud Sphere等构建的广电行业云,实现了单集群规模1000+节点、总规模达到1500+节点,位列全球TOP5,为业务部门提供虚拟机、裸机、文件、网络、安全等各类资源,满足对高并发及安全稳定的需求。在金融行业,浪潮成功实施了国内最大金融生产云,某银行通过InCloud OpenStack搭建了1000+节点的云平台环境,承载手机银行、智能ATM、分行前置系统等业务系统环境,日交易峰值超过6千多万笔,交易峰值同比增长42%。
不过,张东也强调:“随着云与AI、大数据、物联网等更多技术的融合,以及应用规模的持续扩大,数据中心的规模化、集中化趋势将更加明显。对于大型用户而言,单集群的纵向扩展和多集群的横向扩展将同样重要,大规模集群部署与多云异构管理将是大型数据中心治理的两大重要命题。”
目前,浪潮云海OS进一步强化全栈云能力,可实现全栈应用承载、全栈基础设施构建与管理,同时以InCloud Manager为核心开发的多云管理解决方案可实现多云多数据中心的统一管理,帮助中大型企业用户应对多云时代的挑战。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。