7月25日,在在中国信息通信研究院、中国通信标准化协会联合主办的第十届可信云大会上,业界首批《一云多芯技术能力标准体系》评估结果正式发布。浪潮云海以优异成绩通过一云多芯IaaS平台能力评估,获得“先进级”最高等级认证,为客户提供广泛兼容、一致稳定、性能出色的一云多芯云环境,确保业务连续性的同时加速业务创新。
浪潮云海首批通过中国信通院“一云多芯”标准认证
浪潮云海获一云多芯IaaS平台最高评级
“一云多芯”被信通院列为2023年度云计算关键词之一。
为推动一云多芯规范化、高质量发展,中国信通院联合浪潮云海、阿里云等数十家行业龙头企业共同制定《一云多芯技术能力标准体系》。这是业界首个一云多芯标准,从多个维度规范产品和解决方案的技术要求,为用户采纳”一云多芯“云产品提供参考指导。更重要的是,统一的标准体系,将有助于解决不同类型芯片共存所带来的多云管理挑战,真正形成企业内部一朵云。
在首批参与一云多芯IaaS能力评估的众多产品中,浪潮云海OS在兼容能力、基础服务能力、运维运营管理、高可用、平台安全等各个维度均取得优异成绩,最终获得最高等级“先进级”评估认证。首批评估结果也圈定了一云多芯产品和服务商第一梯队,成为用户采购选型私有云的风向标。
此前,浪潮云海完成业界首个面向一云多芯场景的SPEC Cloud基准测试,在三种处理器节点混合部署集群测试中,相对可扩展性、平均实例配置时间等指标均达到全球领先水平,验证了浪潮云海OS在业务应用跨处理器架构场景下的高效率、高性能和高扩展能力,建立了以“一云多芯”为核心的新一代云平台参考基准。
这背后,基于龙蜥社区的服务器操作系统KeyarchOS作为浪潮云海的默认底座,全面支撑浪潮云海一云多芯关键技术的创新和应用。
浪潮云海在“一云多芯“领域布局良久积淀深厚,先后与国家部委、标准制定单位等联合发布政务、金融、央国企等各领域应用创新指南、全球最大规模单一集群云数智融合实践白皮书等,为行业标准和实践落地提供指引与借鉴。
一云多芯是云计算创新发展的关键
在“一云多芯”标准评估体系发布的背后,实际上是用户云基础设施需求迭代的现实。近年来,随着大规模异构算力资源和海量数据应用的增长,云基础设施底座的多元化发展成为云厂商和企业的战略目标。不同类型的芯片为基础设施底座提供异构多元化算力,成为云计算发展的关键。
一云多芯技术的价值体现在以下四方面:一是,一云多芯技术通过纳管不同指令集的芯片,包括CPU、GPU、DPU等,为各类应用场景提供异构多元化的算力支持,从而满足不同业务需求的高性能计算和数据处理要求。二是,一云多芯技术实现了统一资源调度和管理,使得企业和云服务提供商能够更加灵活地配置和分配计算资源,提高资源利用率,降低成本。三是,一云多芯技术还能够提供一致性的开发和部署环境,简化应用的迁移和管理,提高应用的稳定性和可靠性。四是,一云多芯技术的应用推动了IT产业链的创新发展,激发了新的商机和合作机会,为数字化转型和数字经济的发展注入新活力。
随着一云多芯逐渐成为一种“刚需”,势必会成为未来云计算平台必须具备的核心能力之一,其不仅是是芯与云的融合,更是平台+生态的协同。
浪潮云海推动产业生态协同发展
作为国内领先的私有云厂商,浪潮云海始终坚持开放路线,秉承一云多芯“分层解耦、开放标准”的建设原则,与产业链上下游伙伴协同创新,推动一云多芯技术创新与产业生态繁荣。
一云多芯的最终目标是支撑用户业务在不同架构处理器之间的低成本切换或者自由切换。因此,浪潮云海提出“有-好-优”三步走,来实现一云多芯的中长期目标:
第一阶段,混合部署、统一管理、统一视图。通过云操作系统实现异构处理器服务器的统一管理,解决云资源池只能承载单一厂商或单一架构处理器的服务器而导致的应用无法跨架构部署、协同的问题。
第二阶段,业务牵引、分层解耦、架构升级。进一步实现应用的低成本跨架构切换。通过资源层、平台层和应用层的“分层解耦”设计,实现架构升级。
第三阶段,算力标准、全栈多芯、生态共建。共同推动应用与云基础设施的一云多芯相结合,打造垂直一体化方案,实现应用层面的跨架构无感知切换。在标准和测评方面,联合专业软件测评机构及产业链上下游生态,形成一云多芯行业标准。
浪潮云海已帮助政府、金融、能源等数百家行业用户构建了领先的“一云多芯”云平台。其中,浪潮云海配合某国有大型银行进行了一云多芯的实践,使用多种芯片服务器和云海OS,完成了核心MPP数仓产品的认证测试并实现大规模生产系统应用。此外,浪潮云海帮助某省构建了省市县三级一云多芯云平台,不仅支持ARM、LoongArch等多种处理器架构,同时完全兼容中间件、数据库、安全软件等多种应用软件,为全省10余个地市,数万政务终端提供云服务。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。