科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道服务器组件Nehalem-EX:1TB内存+大型主机级的可靠性

Nehalem-EX:1TB内存+大型主机级的可靠性

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

今年9月英特尔公司在美国旧金山召开的IDF大会上展示了支持8核16线程Nehalem-EX(代号Beckton)架构CPU的服务器,并表示将从2010年年初开始出货。这次我们的话题就是Nehalem-EX。

来源:ZDNet编译 2009年10月23日

关键字: RAS Intel Nehalem-EX

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共7页)

■ RAS功能维持系统持续运转

Nehalem-EX最大的特点就是采用了RAS功能。RAS功能涉及到的不仅仅是CPU,还有QPI、内存和I/O集线器

可以说Nehalem-EX的最大特点就是RAS(Reliabilit,Availability,Serviceability:可靠性、可用性和可服务性)功能了。RAS功能可以在系统的不同组件发生故障的时候将其割离开来,确保系统的持续运行。

Nehalem-EX具备所谓的Corrected Machine Check Interrupts(CMCI)和Recoverable Machine Check Architecture(MCA)功能。

例如,如果Nehalem-EX发生CPU内核之间的冲突,它会检查故障,重新设置CPU,割离导致故障的源头,保持系统的持续运转。当然,这不仅仅需要重新设置硬件,还要检查操作系统方面的问题。

因此,Nehalem-EX的RAS功能需要在操作系统方面的支持。这次IDF大会上展示了Nehalem-EX在VMware ESX和Windows Server 2008 R2等操作系统下的RAS功能。此外,Nehalem-EX的RAS功能还支持Novell SUSE Linux和Red Hat Enterprise Linux等。

CPU错误通过CMCI传达给操作系统

通过CMCI干涉来进行操作系统恢复

Nehalem-EX的RAS功能不仅仅涉及CPU内核,还有CPU的I/O、QPI、内存和I/O集线器等多个方面。例如,如果与QPI连接的是CPU,那么发生故障的时候不仅要检查QPI,还要检查I/O集线器。然后,如果导致故障的是与QPI连接的CPU,那么就会自动断开这个CPU,再重新设置系统。

内存方面,Nehalem-EX可以隔离开SMI(Scalable Memory Interface)。因此,即使一个DIMM发生故障,每个SMB(Scalable Memory Buffer)也可以被分开。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章