至顶网服务器频道 05月31日 新闻消息:浪潮关键应用主机天梭M13是我国自主研制的在线交易处理性能最强的单机服务器系统,面向对稳定性和可用性极高的银行、政府、大企业的超大型数据库应用而设计。关键业务计算处理的是高价值、高质量的数据,例如银行卡系统、个人信贷审批、会计审批、中央社保管理系统等等,这类数据是一个企业的核心业务数据,被誉为"数据金矿",重要性不言而喻。在银行、保险等行业的关键业务中,这些数据容不得半点错误。
关键业务呈现出复杂性、强时效性和高并发等特点,对IT系统不光提出了性能的要求,更提出了高稳定性、高可用性的要求。而高可用性正是天梭M13最大的特点,多层级RAS特性设计是一个自顶向下的系统工程,浪潮在硬件、系统和应用等三个层面采用了整体性的高可用技术,使得天梭M13系统能够提供7*24的业务连续性。本文介绍天梭M13关键应用主机的众多高可用技术之一-分段内存镜像功能。
浪潮天梭M13关键应用主机
分段内存镜像功能: 提高系统可用性的同时减少内存资源浪费
内存故障是引起系统停机的主要原因之,内存镜像功能(Memory Mirroring)是解决这一问题的重要手段。内存镜像功能是服务器上重要的RAS特性之一,指将服务器上的内存分为两个频道,一个频道是另一个频道的镜像,用来创建内存的冗余副本,在主内存数据发生错误时自动从镜像内存中读取,从而确保整个系统的稳定可靠。但此技术原则上需要牺牲整个系统一半的内存容量为代价,这对于最高可配备48TB内存容量的天梭M13来说无疑是难以接受的。
目前较新的Intel处理器已支持分段内存镜像技术(即部分内存镜像特征),利用此特性,天梭M13可在其搭载的关键应用系统K-UX(3.2或更高版本)中人为指定某块区域作为镜像,将关键核心数据放入镜像内存区,以享受内存镜像功能带来的高可用性,非关键数据所占内存区域不做镜像处理。这样既保证了核心业务稳定运行,又极大程度避免了内存资源的浪费。
分段内存镜像功能如何实现?
如图所示ch0的Region1和ch2的Region1被设置为内存镜像区域,其他Region没有配置镜像,(总内存容量-内存镜像区域配置容量)即为OS实际可用内存容量。
另外这一特性也需要OS层面支持,原理如下:
在NUMA架构的服务器上,每个物理CPU为一个node,可以通过BIOS为每个node上配置分段j内存镜像区域,OS解析BIOS上传的EFI内存区域属性配置表,调整内存管理区域,保证内核关键数据使用的内存分配在内存镜像区域,应用程序使用的内存分配在非镜像区域。
对于一个由两个node 组成的系统,在每个node上都配有mirror 区域,OS将镜像区域设置为normal,用于分配内核数据;非镜像区域设置为movable,用于分配应用层数据。
K-UX 3.2及以上版本提供对分段内存镜像的支持。系统启动时通过BIOS设置分段内存镜像区域,建议预留不低于内存总容量的1/64作为内存镜像区域。操作系统默认关闭内存镜像特性,用户可根据实际情况选择配置操作系统内存镜像相关属性。
浪潮关键应用主机天梭M13强大的高可用技术,可以有效避免硬件故障、单点设备故障以及数据中心灾害等各种情况对系统业务的影响,帮助客户应对移动互联时代对IT基础设施带来的挑战。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。