至顶网服务器频道 05月31日 新闻消息:浪潮关键应用主机天梭M13是我国自主研制的在线交易处理性能最强的单机服务器系统,面向对稳定性和可用性极高的银行、政府、大企业的超大型数据库应用而设计。关键业务计算处理的是高价值、高质量的数据,例如银行卡系统、个人信贷审批、会计审批、中央社保管理系统等等,这类数据是一个企业的核心业务数据,被誉为"数据金矿",重要性不言而喻。在银行、保险等行业的关键业务中,这些数据容不得半点错误。
关键业务呈现出复杂性、强时效性和高并发等特点,对IT系统不光提出了性能的要求,更提出了高稳定性、高可用性的要求。而高可用性正是天梭M13最大的特点,多层级RAS特性设计是一个自顶向下的系统工程,浪潮在硬件、系统和应用等三个层面采用了整体性的高可用技术,使得天梭M13系统能够提供7*24的业务连续性。本文介绍天梭M13关键应用主机的众多高可用技术之一-分段内存镜像功能。

浪潮天梭M13关键应用主机
分段内存镜像功能: 提高系统可用性的同时减少内存资源浪费
内存故障是引起系统停机的主要原因之,内存镜像功能(Memory Mirroring)是解决这一问题的重要手段。内存镜像功能是服务器上重要的RAS特性之一,指将服务器上的内存分为两个频道,一个频道是另一个频道的镜像,用来创建内存的冗余副本,在主内存数据发生错误时自动从镜像内存中读取,从而确保整个系统的稳定可靠。但此技术原则上需要牺牲整个系统一半的内存容量为代价,这对于最高可配备48TB内存容量的天梭M13来说无疑是难以接受的。
目前较新的Intel处理器已支持分段内存镜像技术(即部分内存镜像特征),利用此特性,天梭M13可在其搭载的关键应用系统K-UX(3.2或更高版本)中人为指定某块区域作为镜像,将关键核心数据放入镜像内存区,以享受内存镜像功能带来的高可用性,非关键数据所占内存区域不做镜像处理。这样既保证了核心业务稳定运行,又极大程度避免了内存资源的浪费。
分段内存镜像功能如何实现?
如图所示ch0的Region1和ch2的Region1被设置为内存镜像区域,其他Region没有配置镜像,(总内存容量-内存镜像区域配置容量)即为OS实际可用内存容量。
另外这一特性也需要OS层面支持,原理如下:
在NUMA架构的服务器上,每个物理CPU为一个node,可以通过BIOS为每个node上配置分段j内存镜像区域,OS解析BIOS上传的EFI内存区域属性配置表,调整内存管理区域,保证内核关键数据使用的内存分配在内存镜像区域,应用程序使用的内存分配在非镜像区域。
对于一个由两个node 组成的系统,在每个node上都配有mirror 区域,OS将镜像区域设置为normal,用于分配内核数据;非镜像区域设置为movable,用于分配应用层数据。
K-UX 3.2及以上版本提供对分段内存镜像的支持。系统启动时通过BIOS设置分段内存镜像区域,建议预留不低于内存总容量的1/64作为内存镜像区域。操作系统默认关闭内存镜像特性,用户可根据实际情况选择配置操作系统内存镜像相关属性。
浪潮关键应用主机天梭M13强大的高可用技术,可以有效避免硬件故障、单点设备故障以及数据中心灾害等各种情况对系统业务的影响,帮助客户应对移动互联时代对IT基础设施带来的挑战。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。