扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共10页)
8、从Westmere到Sandy-Bridge至强一骑绝尘
代号“Westmere-EP”的英特尔至强5600系列处理器也在2010年3月发布,可以看做是英特尔至强5500(Nehalem-EP)的升级版。从英特尔“Tick-Tock”的产品推进策略可以看出,Nehalem是45nm工艺成熟之后的Tock年,因此处理器微架构发生了翻天覆地的变化。而Westmere-EP则是同样微架构下的制程工艺进步——首款采用32nm工艺的至强处理器。
同样针对双路服务器市场,与至强5500相比,除了提升了工艺制程外,至强5600的重要变化还体现在:6核心12线程设计、1.86~3.46GHz(四核产品)、2.26~3.33GHz(六核产品)的主频、12MB的更大L3缓存,以及在能耗管理方面的增强技术等。由于决定处理器最关键的因素有处理器微架构和制造工艺,至强5600仍然沿用了至强5500的Nehalem架构,因此,最重要的不同就在于32纳米工艺。和至强5500一样,至强5600采用相同的插槽、芯片组,同样具有两个QPI通道,三个内存通道,支持DDR3规格内存,主频范围基本相当,也支持超线程、Turbo Boost等技术。
其中,低功耗版的四核至强L5609不支持超线程和睿频技术,不过功耗可以低到40W。值得一提的是,英特尔在Westmere中对微内核做了一定的升级,加入了AES增强指令集,,专门用来加密数据。还追加引入了早先就有的Intel Trusted Execution Tech可信计算技术(TXT),从处理器层面大大提升了系统安全性。在虚拟化方面,英特尔优化了微内核内的虚拟页面表单,使其可以存取1Gb的虚拟机页面文件(虚拟内存地址与物理内存地址靠这个表单做映射)。
据英特尔官方的说法称,采用了32nm工艺的至强5600相比上一代产品性能提升了60%,并且可以实现15:1的服务器整合比。
2011年3月,英特尔发布了同样基于Westmere架构的至强E7产品,同期也发布了基于全新Sandy-Bridge架构的至强E3处理器。这是至强家族再一次更换产品线的名称——第一次用DP和MP来称呼,第二次用3000系列、5000系列和7000系列来区分入门级、主流应用和高端多路应用。
我们首先来看代号“Westmere-EX”的至强E7处理器。该系列产品延续了Westmere架构,采用32nm制程工艺,最高型号拥有10核心(20个线程)以及近30MB L3缓存,自发布以来就荣登了x86处理器性能之王的位置。
至强E7除了核心数更多以外,相比上一代至强7500(Nehalem-EX)系列产品,其内存容量扩大了一倍(四路产品可以支持到2TB内存)。此外由于工艺提升至32nm,至强E7还拥有30MB的L3缓存。这些特性使得至强E7较上一代至强7500有了近40%的性能提升。
而在虚拟化方面,至强E7支持VT-x3实模式寻址与1GB虚拟页面支持(与Westmere-EP相同的改进),从而改善了虚拟机的切换潜伏时间。新加入的C6节能模式可以让应用和核心运行状态关联更紧密,当系统认为某个线程空闲时,相应的处理器核心也将进入C6节能状态,这项技术对于大规模数据中心来说非常关键,可以大大节省能耗成本。
相较于至强7500引入的RAS特性以面向关键业务应用,至强E7则进一步增强了这些特性,如机器校验架构恢复(MCA-R)能够让系统在发生特定内存错误时正常运行,双设备数据更正(DDDC)可以在两个内存设备出现故障时恢复数据,部分内存镜像功能则可选择性地对最重要的内存区域进行镜像,既能降低成本,又提高了数据保护的灵活性。Intel AES New Instructions (Intel AES-NI)可以保护企业和云计算环境中敏感的业务数据和私密数据,Intel Trusted Execution Technology (Intel TXT)则可以进一步保护虚拟化环境的安全。
如果说E7延续了英特尔多路7系列性能之王的称号,那么至强E3就是Sandy-Bridge架构首次进入至强家族的惊艳露面。
与E7家族同时推出的至强E3-1200系列处理器主要面向入门级服务器和工作站,与以往的3000系列至强产品一样,该产品与桌面级Sandy-Bridge架构第二代酷睿i7有着血缘关系,只支持单路产品自不用说,其主频分布在2.2GHz~3.5GHz,只有两款不支持HT超线程技术,全线产品都支持Turbo Boost睿频技术,并且在E3-1260L、E3-1225、E3-1235、E3-1245、E3-1275等产品中集成了HD 200“核芯”显卡(E3-1260L是HD100)。包括低功耗版本在内的处理器功耗分布在20W~95W之间。
至强E3的亮点主要在Sandy-Bridge架构的首次登场,其新型环形总线设计、AVX向量指令集和同DIE集成的GPU是最主要特点。早先处理器内核与System Agent(北桥,后部分集成在CPU内)的通讯采用的交叉通路,这使得在多核时代其设计越发复杂和低效,而在Sandy-Bridge中启用的全新Ring Bus环形总线则很轻松的将CPU各个核心、GPU以及北桥连接在在了一起。
环形总线的存在,可以大大减少核心访问三级缓存的周期。在以往的产品中,多个核心共享一个三级缓存,需要访问的话必须先经过流水线发送请求,在进行优先级排序之后才能进行。新的环形总线将三级缓存分割成了若干部分,借助于每个站台,核心可以快速的访问LLC。LLC小容量缓存的延迟优势与核心频率一致性在这里也就体现了出来,这就使得Sandy Bridge的周期相比以往产品有所缩减,从原来的35-40个缩减到了26-31个。同时,由于每个核心与LLC之间可以提供若干带宽,使得Sandy Bridge的整体带宽也提升了4倍。
相比带宽的提升,AVX向量指令集首次随着至强E3出现在至强家族中意义重大。这让向量宽度一举从128位增加到了256位,原有的16个128位XMM寄存器也一举扩充为256位YMM寄存器,可以同时处理8个单精度浮点数和4个双精度浮点数。换句话说,Sandy Bridge的浮点吞吐能力可以达到前代的两倍。
此外,AVX指令集的出现对于原有的X86指令集也进行了优化与重新组合——这主要源于AVX指令集新的操作码编码方式。AVX指令集的编码方式叫做VEX(Vector Extension),其主要用途是缩短指令长度,降低无谓的代码冗余,并且也降低了对解码器的压力,实现的方式也很特别——压缩各式各样的Prefix前缀,集中到一个比较固定的字段中,从而达到了精简指令集的目的。
最后提一下GPU,对于企业级应用来说核内GPU有些多余——这部分晶体管不如用来做Cache来的实惠。然而对于入门级服务器和工作站来说,至强E3提供的核内GPU可以轻松的提供图形环境,省去了部分成本。而同DIE集成GPU的做法也大大降低了系统功耗,提升了GPU性能。Sandy-Bridge架构里的GPU也支持睿频技术,这意味着其可以独立的加速或降速,并与CPU共享L3缓存。而可编程着色硬件的加入,使得Sandy-Bridge在视频转码等方面的具有独特的优势。
不过也可以看到,英特尔只在部分E3中提供了集成显卡,另一部分则没有——很显然对于想用独立显卡的用户来说,可以选择这部分没有GPU部分的CPU,以获得更高的计算性能。而原定于2011年底发布的Sandy-Bridge至强E5系列处理器,则延期到了2012年第一季度发布。从目前得到的数据来看,面向主流服务器市场的至强E5是不会集成GPU的,其实际性能还是未知数。
亲,盘点到这里至强家族的主要产品就说完了,零散信息肯定有诸多不全面的地方,但是相应要点基本都说到了。想了解未来英特尔至强E5系列处理器的动向么?2013年英特尔将切换至22nm制程工艺哟,Ivy-Bridge架构出路器将粉末登场,而更遥远的2014年,22nm工艺下的全新Haswell架构也会降世临凡。亲,期待您跟随ZDNet服务器频道共同鉴证哟。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者