扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共5页)
至强7500系统RAS设计之增强数据完整性
系统的可靠性在很大程度上是指逻辑上的可靠,即数据的完整性。作为计算设备,必须要保证数据准确无误,而这种可靠则来自于对数据的各种保护措施。如果从数据处理的层面上讲,数据的可靠性是一个系统的实现高可用的基础,否则数据接二连三的出问题,可用性也就无从谈起了,所以保证数据的逻辑正确是最最基本的。
处理器/插槽级设计
错误数据防泄漏模式(Corrupt data containment mode):当数据发生错误时,相应的内存存储单元将会被标记出来(有时称之为“数据中毒”),以限制其对当前运行的程序所造成的影响,从而减少对系统重启的需求,这一功能在至强7400上是没有的。
病毒模式(Viral mode):当系统检测到一个不可纠正的错误时,所有含有错误位的数据包将向系统通告这一错误,一些相应单元的功能将自动停止以预防错误的蔓延。就像病毒那样,杜绝错误数据的繁殖,这一功能在至强7400上也是没有的。
内存级设计
奇偶校验(Parity checking)与错误修正码(ECC):运用相应的校验算法来检测并修正软错误,这是最基本的内存数据保护技术,至强7400系统也同样具备。
热量疏导(Thermal throttling): 当内存的发热已经达到危险的临界水平时,意味着内存可能会出现不稳定的情况,此时系统将会减少对于内存的指令密度,或是加大散热风扇的转速,以保证内存子系统的散热与稳定,至强7400系统也具备这一功能。
请求与巡视清除(Demand and patrol scrubbing): 内存始终处于不断的错误监测状态下,从而可确保不会造成错误积累到不可修复的程度,这其中它将随时监测内存的性能表现(巡视),并在读取传输(请求)过程中检测可修正的错误,并及时进行清除与修正。这项技术在至强7400平台与有使用。
英特尔QuickPath Interconnect总线级设计
基于8或16bit滚动CRC检测的QPI保护机制:采用8位或16位的CRC(Cyclic Redundancy Checking,循环冗余检查)机制来进行QPI数据链路的校验,以完成对数据的检测与纠错。由于至强7400平台是采用传统的前端总线(FSB)架构,所以这一技术由至强7500独享受,也让QPI具备了比FSB更高的可靠性与可用性。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者