扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:ZDNet编译 2009年10月23日
关键字: RAS Intel Nehalem-EX
在本页阅读全文(共7页)
■ RAS功能维持系统持续运转
Nehalem-EX最大的特点就是采用了RAS功能。RAS功能涉及到的不仅仅是CPU,还有QPI、内存和I/O集线器
可以说Nehalem-EX的最大特点就是RAS(Reliabilit,Availability,Serviceability:可靠性、可用性和可服务性)功能了。RAS功能可以在系统的不同组件发生故障的时候将其割离开来,确保系统的持续运行。
Nehalem-EX具备所谓的Corrected Machine Check Interrupts(CMCI)和Recoverable Machine Check Architecture(MCA)功能。
例如,如果Nehalem-EX发生CPU内核之间的冲突,它会检查故障,重新设置CPU,割离导致故障的源头,保持系统的持续运转。当然,这不仅仅需要重新设置硬件,还要检查操作系统方面的问题。
因此,Nehalem-EX的RAS功能需要在操作系统方面的支持。这次IDF大会上展示了Nehalem-EX在VMware ESX和Windows Server 2008 R2等操作系统下的RAS功能。此外,Nehalem-EX的RAS功能还支持Novell SUSE Linux和Red Hat Enterprise Linux等。
CPU错误通过CMCI传达给操作系统
通过CMCI干涉来进行操作系统恢复
Nehalem-EX的RAS功能不仅仅涉及CPU内核,还有CPU的I/O、QPI、内存和I/O集线器等多个方面。例如,如果与QPI连接的是CPU,那么发生故障的时候不仅要检查QPI,还要检查I/O集线器。然后,如果导致故障的是与QPI连接的CPU,那么就会自动断开这个CPU,再重新设置系统。
内存方面,Nehalem-EX可以隔离开SMI(Scalable Memory Interface)。因此,即使一个DIMM发生故障,每个SMB(Scalable Memory Buffer)也可以被分开。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者