扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNet至顶网服务器频道 10月27日 原创文章(文/孟庆):罗马不是一天就建成的——时至今日,x86架构处理器以席卷天下的态势从PC端延伸到服务器领域,一举打破早期由RISC架构处理器统一企业级计算业务的传统市场。在不断用高性价比的x86服务器占据企业数据中心的同时,在HPC高性能计算领域我们也看到x86阵营攻城掠地,进而在最新的全球Top500超算排行榜单中占据了超过80%以上的份额。
相比早期服务器市场在RISC架构下互相割裂,彼此独立的生态圈(如IBM的Power、Sun和富士通的SPARC、惠普的PA-RISC以及原来康柏旗下的Alpha等),x86处理器(此处指英特尔至强E7)在性能上已经不弱于当今最强的RISC架构处理器Power 7,而在可靠性和稳定性方面英特尔也在不断的通过指令集、新内核架构设计等方式拉近x86产品与传统小型机的距离。这一切直接导致了x86服务器占据了全球服务器出货量的95%,同时占有率接近60%(IDC 2010年底数据)。
而在x86生态圈发展过程中功不可没的领军企业,非处理器巨头英特尔莫属。从1995年推出奔腾Pro进入企业级应用领域,到1998年推出奔腾II架构的至强品牌并延续至今——英特尔一直在不断创新和推动整个x86产业链的发展,通过创新的设计不断提高x86架构处理器的性能,并不断提升制程工艺技术,以减少能耗和降低成本——这为x86生态圈提供了一个性能不断跃进,成本持续低廉,应用迁移性强的发展环境。
英特尔至强(Xeon)处理器在x86服务器中的占有率已经超过了90%。翻开至强处理器14年的发展历史(1998~2011),我们看到,这款处理器已经发生了巨大的变化:经过了P6(奔腾II/III)、Netburst(奔腾4)、酷睿、Nehalem、Westmere和最新的Sandy-Bridge等几代微架构的变迁,制造工艺从最早的250纳米提升了现在的32纳米,CPU内核数量从单核发展到了10核,主频从400MHz提升到3.8GHz(超多核心处理器由于功耗控制,主频没有那么高),前端总线带宽从100MHz发展到了1.6GHz,并最终转换到了全新的QPI直联架构(最高6.4GT/s),指令集和诸如超线程、智能节能、虚拟化等功能不断推陈出新……
正值英特尔推出第一款(1971年的4004)半导体芯片40周年之际,ZDNet服务器频道推出重磅回顾文章,盘点至强处理器家族诞生至今的一系列重要产品……
1、Pentium II Xeon处理器
如前文所述,英特尔的第一款商用处理器是Pentium Pro,但是真正启用Xeon至强品牌的商用产品是Pentium II Xeon。该产品系列主要定位在商用领域,包括中高端企业级服务器和工作站市场。从战略上看,这是英特尔高瞻远瞩的首次将x86的发展引向了企业级(注意,在当时企业级领域是RISC的天下,x86被认为是“玩具”)。
Pentium II 至强是一个“Deschutes”核心的 Pentium II(共享产品代码:80523),它有全速512KB,1MB,或2MB二级(L2)缓存,二级缓存是由英特尔定制开发的512KB的SRAM实现的,SRAM的数量依赖于缓存的数量,512KB配置需要一个SRAM,1MB配置需要两个SRAM,2MB配置在PCB的两面需要四个SRAM,在0.35微米四层金属CMOS工艺下每片SRAM的面积是12.90毫米*17.23毫米(222.21平方毫米),使用接合面向下线焊式触点陈列封装(land grid array,LGA)方式封装。
与普通Pentium II不同之处在于,Pentium II Xeon处理器使用了Slot 2插槽,以方便大容量缓存地址线和主板间的通讯。更重要的是,由于它支持440GX双路处理器工作站和450NX四路/八路芯片组,因此开启了x86架构下SMP对称多路服务器的发展之路(之后双路以上服务器渐成主流)。至此,英特尔完成了桌面CPU和服务器CPU格局的划分,为日后服务器的发展,奠定了基础。
2、Pentium III 至强
1999年,Pentium III 至强替代了Pentium II 至强,反映了从Pentium II “Deschutes”核心到Pentium III “Katmai”核心的增量变化。第一款Pentium III 至强叫做“Tanner”,除了增加Streaming SIMD Extensions (SSE)指令集和一些缓存控制器增强外,其它都和它的前辈一样。
除此之外,Pentium III至强处理器开始多元化发展,分为高端和低端两条线,其中低端产品叫做“Cascades”,基于Pentium III “Coppermine”核心,“Cascades”至强使用133MT/s总线,256KB二级缓存,性能和Slot 1上的Coppermine处理器差不多,有能力进行双处理器运算,但不能进行四处理器运算。而另一个高端版本尽管也叫做“Cascades”,但通常都指的是“Cascades 2 MB”,带来了两种不同的版本:1MB二级缓存和2MB二级缓存。总线速度被固定在100MT/s,产品代码Tanner和Cascades分别对应Katmai(80525)和Coppermine(80526)。
相比之下,256KB二级缓存对于低端Pentium III至强的性能影响较大,但对于小型企业应用来说性价比较为合适。至强处理器的产品线也开始基于高端市场和低端市场的区隔发展下去。
3、32位至强DP和至强MP
2001年中期英特尔正式引入了至强商标,去掉了Pentium字样(其实也是彻底脱去了消费级的品牌)。最初的时候使用新的NetBurst架构,“Foster”和桌面级Pentium 4(代号“Willamette”)只有很小的差异,面向工作站平台。
而到了2002年英特尔发布了一款130纳米至强 CPU,代号“Prestonia”,它支持英特尔新的超线程技术(HT),二级缓存512KB,基于“Northwood” Pentium 4核心,新的服务器芯片组E7500(它允许使用双通道DDR SDRAM)也随之发布,以支持这款服务器处理器,总线速度上升到533 MT/s(伴随新的芯片组:E7501和E7505工作站芯片组)。
之后,英特尔还推出了专门针对多路系统的至强MP处理器,其代号是“Gallatin”,它有两个版本:1MB三级缓存和2MB三级缓存。它的至强 MP版本也比Foster MP性能要好,在服务器上非常流行。在经历了130纳米工艺后,英特尔创建了至强 MP商标,具有4MB缓存的Gallatin,至强Prestonia和Gallatin的代号都是80532。
4、64位至强DP和至强MP
2004年6月30日,Intel发布了最先支持IA-32E的处理器—代号为“Nocona”的64位Xeon处理器(即Prescott核心的 Xeon DP ),这是第一个64位至强处理器核心,采用90nm工艺制程,具有800MHz前端总线技术,(比较以前的FSB 533MHz大幅提升),16KB L1缓存、1MB L2缓存和12KB uOps Trace,支持超线程和SEE-3技术。CPU起跳频率为2.8GHz,同时还有3GHz、3.2GHz、3.4GHz和3.6GHz型号的产品问世。
Nocona使用604针PPGA封装,与533MHz主频Xeon处理器所用的处理器插座一样,它支持Intel Speedstep技术、Hyperthreading以及Extended Memory 64技术。此外,该处理器还引入了一项称为DBS的节电技术,这使得CPU能够在空闲时自动降低处理器的倍频、前端总线频率和电压,这样就降低了机器空闲时浪费的功耗。与AMD的Opteron不同,Nocona内部仍然没有集成内存控制器,其MCH仍集成在北桥芯片E7525上,这就意味着Nocona在多路处理时,两颗并行处理器必须共享内存带宽。
2005年早期英特尔发布了局部进行更新的版本,代号“Irwindale”,二级缓存是Nocona的两倍,在低处理需求时可以减少它的时钟速度,虽然它比Nocona更有竞争性。而64位至强 MP于2005年4月发布,廉价的“Cranford”是Nocona的MP版本,价格更高的“Potomac”是具有8MB三级缓存的Cranford版本,所有这些衍生自Prescott的至强产品代码都是80546。
5、双核诞生 3000/5000/7000系列至强初现
2005年10月,英特尔凭借自己长久以来在封装技术上的优势,发布了其首枚双核至强处理器代号“Paxville DP”,使用NetBrust架构,二级缓存达到了4MB(2*2MB)。由于沿用了NetBrust架构,工艺又是90nm,因此其功耗过大而性能显得不足,很多人批评该处理器是胶水双核,用来应对竞争对手产品的仓促之作。
而紧接着在2006年3月,英特尔又发布了首款代号“Sossaman”的超低功耗双核处理器,该产品首次标注了至强LV(low-voltage,低电压)字样,并紧接着发布了ULV(ultra-low-voltage,超低电压)版本。
其实这款产品可以看做是英特尔吸取功耗过高的经验教训而推出的,其热设计功耗仅为31W,基于原先为笔记本平台设计的“Yonah”核心而演变来的。因此虽然该低功耗至强支持一系列早期至强的特性:VT虚拟化技术等,但不支持64位运算,因此支持的软件和数据库被限制,而诸如内存被限制为16GB大小也大大限制了它的发挥。
同年11月,英特尔发布了至强7000系列的首款产品“Paxville MP”,基于90nm工艺制造,主频从2.67GHz到3.0GHz,存在两个版本,分别拥有2MB二级缓存(2*1MB)和4MB二级缓存(2*2MB),FSB前端总线速度为667MT/s~800MT/s。
2006年5月,英特尔又发布了至强5000系列的首个双核产品“Dempsey”,虽然仍是NetBurst架构,但是该处理器使用了65nm工艺生产,大大降低了功耗。Dempsey的时钟范围在2.50GHz到3.73GHz之间(型号5020-5080),其前端总线的速度在667MT/s到1066MT/s之间,二级缓存4MB(2*2MB),新插槽是著名的LGA771。
然而同年6月,英特尔又发布了代号为“Woodcrest”的双核至强5100系列处理器,该系列是第一款上市的酷睿微架构处理器,英特尔表示其性能提高幅度达80%,而功耗则降低了至少20%,可谓一款革命性的产品。
在FSB前端总线速度方面,除了5110和5120外,都是1333MT/s,最快的处理器(型号5160)主频则达到了3.0GHz,所有Woodcrest都使用LGA 771接口,除了两款其它TDP都是65W,5160 TDP为80W,5148LV(2.33GHz)TDP为40W。所有型号都支持英特尔64位计算(英特尔x86-64实现)和虚拟化技术,“按需供电”电源管理选项仅在双核至强 5140及以上版本中才有,Woodcrest有4MB共享二级缓存。
8月末,英特尔升级了至强7000系列产品线,发布了代号为“Tulsa”的至强7100系列产品,基于65nm工艺,主频为2.6GHz~3.4GHz。该处理器是Paxville MP的升级版本,具有2MB二级缓存(2*1MB)和4~16MB不等的三级缓存,FSB前端总线速度则在667MT/s到1066MT/s之间。
2006年9月,英特尔还发布了代号为“Conroe”的双核至强3000系列处理器,不过该产品基本上和消费级酷睿2 Duo没有区别,主要面向工作站和入门级应用。3000系列至强产品只支持单路处理器,采用和桌面平台一样的LGA 775接口,FSB速度1066MHz,虽然支持英特尔VT虚拟化技术,但是并不支持HT超线程。之后发布的“Wolfdale”至强3100系列产品也只是对原来Wolfdale做了阉割,虽然使用了65nm工艺和6MB二级缓存,但是仍然只支持单路计算。
2006年对于至强产品线来说很关键,一方面大量的双核产品发布,另一方面也区分开了面向多路高端市场的7000系列产品,面向主流市场的5000系列和面向入门级的3000系列产品线。而最重要的是基于英特尔酷睿微架构的至强处理器一举使得x86处理器的性能有了飞跃式的提升。
6、从四核到六核:至强完成量变
2006年11月英特尔首先在至强5000这条产品线发布了代号为“Clovertown”的四核处理器,其型号包括E5310、E5320、E5335、E5345和X5355,时钟范围从1.6GHz到2.66GHz。该处理器由两块双核Woodcrest芯片组成,二级缓存8MB(每芯片4MB),和Woodcrest类似,低端型号使用1066MT/s FSB前端总线,高端型号速度可以达到1333MT/s。
而早先的低电压版本至强处理器则融入了各个产品线,在至强5300中有L5310、L5320和L5335三个低电压版本,频率在1.6~2.0GHz。
2007年1月英特尔发布了基于桌面级酷睿2 Quad的至强3200系列处理器(代号“Kentsfield”),其结构基本与桌面产品一致,包括只支持单路运算等。与早期英特尔所有四核产品一样,这款处理器也是2x2四核心包括两个独立的双核芯片,包括三个型号X3210、X3220和X3230,分别运行在2.13GHz、2.4GHz和2.66GHz。
值得一提的是同一时期,英特尔还发布了至强3300系列处理器,代号“Yorkfield”,采用了先进的45nm工艺,型号包括X3320、X3350、X3360和X3370,分别运行在2.50GHz、2.66GHz、2.83GHz和3.0GHz,每个芯片统一使用6MB二级缓存(但X3320每块芯片二级缓存只有3MB),前端总线1333MHz,所有型号都支持英特尔64位(x86-64实现),XD位和虚拟化技术,也支持按需供电,使用LAG775 Socket。
2007年9月,英特尔至强7300系列处理器发布,代号为“Tigerton”。作为面向MP多路服务器的产品线,虽然至强7300与至强5300一样基于两个酷睿2核心封装,但是在性能上比上一代至强7100好了至少3倍,并且在多路支持上允许每个处理器都是用全部的前端总线带宽,每个服务器最大支持32路。
2007年11月,英特尔发布了基于45nm工艺的至强5400系列处理器——代号“Harpertown”,虽然也是由2块芯片构成的四核处理器,但是前端总线速度从1333MHz到1600MHz,不同型号TDP从50W到150W不等,并且都基于LGA771插槽。
至强5400系列全线处理器均支持x86-64位运算,拥有VT虚拟化技术,并且绝大多数都具备按需供电功能,功耗在50W~120W,主频在2.33~3.33GHz之间。
2008年9月,英特尔迎来了自己第一款6核产品——至强7400。“虚拟照进现实”是该处理器的发布口号。搭配三个统一的3MB大小的二级缓存(有点类似于三个合并的45纳米双核Wolfdale芯片),一级缓存96KB,三级缓存16MB,1066MHz FSB,可以插入Tigerton的mPGA604插槽,与英特尔Caneland和IBM X4芯片组兼容,这些处理器支持DDR2-1066 (533 MHz),最大TDP低于130W,目标定位于刀片和集群应用。
从英特尔处理器内核不断增多的过程来看,多核已经被普遍认可和接受,x86处理器已经从主频攀升转向了多核发展,进而开始围绕内部微架构和解决各种瓶颈问题而不断创新。英特尔自身虽然在2008年拥有了6核产品,然而其封装总有通信间的瓶颈,于是2009年开始英特尔完成了“质变”的过程,华丽的Nehalem开启了新时代。
7、质变:华丽丽的Nehalem至强
2009年3月,英特尔宣布推出基于45nm工艺和全新微架构的至强处理器,代号Nehalem-EP,包括12款至强5500系列产品面向双路主流市场和3款至强3500系列产品面向单路市场。该处理器由于采用了全新的微架构而被称作是自Pentium Pro以来最具革命性的x86服务器处理器产品。
Nehalem-EP系列至强处理器内核数虽然同样为四核,但是与至强5400的最大区别在于统一封装在了一个DIE上,并且将FSB前端总线彻底抛弃,转而采用了QPI总线(快速互联通道),并且加入了能动态调节处理器主频频率和功耗的Turbo Boost睿频技术。此外,HT超线程技术的回归让逻辑处理器一下上升到了8个,而Integrated Power Gate功率门技术和新一代VT硬件虚拟化,集成的三通道DDR3内存控制器都华丽丽的让Nehalem黄袍加身,成为当时x86领域的性能之王。而取代FSB的QPI总线彻底解决了多路互连的瓶颈,是Nehalem架构的精髓所在。
根据英特尔的官方数字,至强5500相比上一代产品性能提升了1.25倍,带宽提升了2.5倍,而功耗则降低了一半。该系列处理器有W、X、E、L五个子类别,除最低端的E5502是双核心型号外均为四核心,集成7.31亿个晶体管,主频1.86-3.20GHz不等,QPI总线频率4.8/5.86/6.4GT/s,三级缓存4/8MB,热设计功耗60/80/95/130W,支持DDR3内存频率低则800MHz、高则1333MHz,最大容量144GB(18×8GB)或192GB(12×16GB),插槽为LGA1366。
Xeon 3500系列代号Nehalem-WS,有W3570/W3540/W3520三款,就规格而言分别与Core i7-965/940/920完全相同,也是四核心八线程、3.20/2.93/2.66GHz频率、8MB三级缓存、QPI总线频率6.4GT/s或4.8GT/s、热设计功耗130W。
此外还有两款嵌入式服务器处理器Xeon L5518/L5508,也是Nehalem架构产物,前者主频2.13GHz、热设计功耗60W,后者主频2.00GHz、热设计功耗38W,均面向通信市场领域,享受长达七年的生命周期支持。
之后,在2010年3月,英特尔又发布了基于Nehalem微架构面向四路和八路市场的至强7500处理器,代号“Nehalem-EX”。该系列处理器与至强7400相比性能提升也是巨大的,首先工艺升级到45nm,意味着功耗的降低,而八核心16线程的设计也让至强7500成为新的性能王。四条QPI总线意味着四路系统中任意两个内核可以直接通讯,通过第三方节点控制器最多可以支持八路并联——也就是单一节点最多可以拥有64核心,128个逻辑线程。
至强7500核心面积近600多平方毫米,集成23亿个晶体管。这么多晶体管,除了八核心之外,还拥有多达24MB的三级缓存,四条QPI总线等。其他如内存控制器、VT硬件虚拟化和睿频支持都与Nehalem-EP相似。但是插槽是LGA 1567,其热设计功耗最高为130W。
至强7500系列处理器首批共有八款型号,其中Xeon X7560/X7550/L7555都是八核心,主频最高2.26GHz,三级缓存最多24MB,热设计功耗最高130W,QPI总线频率最高6.40GT/s;Xeon E7540/E7530/L7545/X7542都是六核心,主频1.86-2.00GHz,三级缓存18MB,热设计功耗95-130W,其中X7542不支持超线程,但主频高达2.66GHz;Xeon E7520则是四核心,主频1.86GHz,三级缓存也有18MB,QPI总线仅为4.80GT/s,不支持Turbo Boost加速技术。
此外还有一个衍生的至强6500系列处理器,包括Xeon X6550/E6540/E6510三款型号,分别为八、六、四核心,专为需要大容量内存的双路服务器提供低价解决方案。
值得注意的是,至强7500中首次引入了多达22条RAS特性,这是原先在传统RISC处理器中才具有的高可靠性和可用性特性。这些特性保证了x86处理器在关键业务中也能一展拳脚。此外,至强7500对内存容量的支持增加了四倍(四路最多1TB),对虚拟机动态迁移的特性支持以及高I/O特性也保证了该产品在虚拟化和数据库业务方面的强势。
英特尔官方介绍表示,至强7500系列处理器的性能是至强7400的三倍,可以取代20套四路单核至强服务器系统,且能耗要低92%。
8、从Westmere到Sandy-Bridge至强一骑绝尘
代号“Westmere-EP”的英特尔至强5600系列处理器也在2010年3月发布,可以看做是英特尔至强5500(Nehalem-EP)的升级版。从英特尔“Tick-Tock”的产品推进策略可以看出,Nehalem是45nm工艺成熟之后的Tock年,因此处理器微架构发生了翻天覆地的变化。而Westmere-EP则是同样微架构下的制程工艺进步——首款采用32nm工艺的至强处理器。
同样针对双路服务器市场,与至强5500相比,除了提升了工艺制程外,至强5600的重要变化还体现在:6核心12线程设计、1.86~3.46GHz(四核产品)、2.26~3.33GHz(六核产品)的主频、12MB的更大L3缓存,以及在能耗管理方面的增强技术等。由于决定处理器最关键的因素有处理器微架构和制造工艺,至强5600仍然沿用了至强5500的Nehalem架构,因此,最重要的不同就在于32纳米工艺。和至强5500一样,至强5600采用相同的插槽、芯片组,同样具有两个QPI通道,三个内存通道,支持DDR3规格内存,主频范围基本相当,也支持超线程、Turbo Boost等技术。
其中,低功耗版的四核至强L5609不支持超线程和睿频技术,不过功耗可以低到40W。值得一提的是,英特尔在Westmere中对微内核做了一定的升级,加入了AES增强指令集,,专门用来加密数据。还追加引入了早先就有的Intel Trusted Execution Tech可信计算技术(TXT),从处理器层面大大提升了系统安全性。在虚拟化方面,英特尔优化了微内核内的虚拟页面表单,使其可以存取1Gb的虚拟机页面文件(虚拟内存地址与物理内存地址靠这个表单做映射)。
据英特尔官方的说法称,采用了32nm工艺的至强5600相比上一代产品性能提升了60%,并且可以实现15:1的服务器整合比。
2011年3月,英特尔发布了同样基于Westmere架构的至强E7产品,同期也发布了基于全新Sandy-Bridge架构的至强E3处理器。这是至强家族再一次更换产品线的名称——第一次用DP和MP来称呼,第二次用3000系列、5000系列和7000系列来区分入门级、主流应用和高端多路应用。
我们首先来看代号“Westmere-EX”的至强E7处理器。该系列产品延续了Westmere架构,采用32nm制程工艺,最高型号拥有10核心(20个线程)以及近30MB L3缓存,自发布以来就荣登了x86处理器性能之王的位置。
至强E7除了核心数更多以外,相比上一代至强7500(Nehalem-EX)系列产品,其内存容量扩大了一倍(四路产品可以支持到2TB内存)。此外由于工艺提升至32nm,至强E7还拥有30MB的L3缓存。这些特性使得至强E7较上一代至强7500有了近40%的性能提升。
而在虚拟化方面,至强E7支持VT-x3实模式寻址与1GB虚拟页面支持(与Westmere-EP相同的改进),从而改善了虚拟机的切换潜伏时间。新加入的C6节能模式可以让应用和核心运行状态关联更紧密,当系统认为某个线程空闲时,相应的处理器核心也将进入C6节能状态,这项技术对于大规模数据中心来说非常关键,可以大大节省能耗成本。
相较于至强7500引入的RAS特性以面向关键业务应用,至强E7则进一步增强了这些特性,如机器校验架构恢复(MCA-R)能够让系统在发生特定内存错误时正常运行,双设备数据更正(DDDC)可以在两个内存设备出现故障时恢复数据,部分内存镜像功能则可选择性地对最重要的内存区域进行镜像,既能降低成本,又提高了数据保护的灵活性。Intel AES New Instructions (Intel AES-NI)可以保护企业和云计算环境中敏感的业务数据和私密数据,Intel Trusted Execution Technology (Intel TXT)则可以进一步保护虚拟化环境的安全。
如果说E7延续了英特尔多路7系列性能之王的称号,那么至强E3就是Sandy-Bridge架构首次进入至强家族的惊艳露面。
与E7家族同时推出的至强E3-1200系列处理器主要面向入门级服务器和工作站,与以往的3000系列至强产品一样,该产品与桌面级Sandy-Bridge架构第二代酷睿i7有着血缘关系,只支持单路产品自不用说,其主频分布在2.2GHz~3.5GHz,只有两款不支持HT超线程技术,全线产品都支持Turbo Boost睿频技术,并且在E3-1260L、E3-1225、E3-1235、E3-1245、E3-1275等产品中集成了HD 200“核芯”显卡(E3-1260L是HD100)。包括低功耗版本在内的处理器功耗分布在20W~95W之间。
至强E3的亮点主要在Sandy-Bridge架构的首次登场,其新型环形总线设计、AVX向量指令集和同DIE集成的GPU是最主要特点。早先处理器内核与System Agent(北桥,后部分集成在CPU内)的通讯采用的交叉通路,这使得在多核时代其设计越发复杂和低效,而在Sandy-Bridge中启用的全新Ring Bus环形总线则很轻松的将CPU各个核心、GPU以及北桥连接在在了一起。
环形总线的存在,可以大大减少核心访问三级缓存的周期。在以往的产品中,多个核心共享一个三级缓存,需要访问的话必须先经过流水线发送请求,在进行优先级排序之后才能进行。新的环形总线将三级缓存分割成了若干部分,借助于每个站台,核心可以快速的访问LLC。LLC小容量缓存的延迟优势与核心频率一致性在这里也就体现了出来,这就使得Sandy Bridge的周期相比以往产品有所缩减,从原来的35-40个缩减到了26-31个。同时,由于每个核心与LLC之间可以提供若干带宽,使得Sandy Bridge的整体带宽也提升了4倍。
相比带宽的提升,AVX向量指令集首次随着至强E3出现在至强家族中意义重大。这让向量宽度一举从128位增加到了256位,原有的16个128位XMM寄存器也一举扩充为256位YMM寄存器,可以同时处理8个单精度浮点数和4个双精度浮点数。换句话说,Sandy Bridge的浮点吞吐能力可以达到前代的两倍。
此外,AVX指令集的出现对于原有的X86指令集也进行了优化与重新组合——这主要源于AVX指令集新的操作码编码方式。AVX指令集的编码方式叫做VEX(Vector Extension),其主要用途是缩短指令长度,降低无谓的代码冗余,并且也降低了对解码器的压力,实现的方式也很特别——压缩各式各样的Prefix前缀,集中到一个比较固定的字段中,从而达到了精简指令集的目的。
最后提一下GPU,对于企业级应用来说核内GPU有些多余——这部分晶体管不如用来做Cache来的实惠。然而对于入门级服务器和工作站来说,至强E3提供的核内GPU可以轻松的提供图形环境,省去了部分成本。而同DIE集成GPU的做法也大大降低了系统功耗,提升了GPU性能。Sandy-Bridge架构里的GPU也支持睿频技术,这意味着其可以独立的加速或降速,并与CPU共享L3缓存。而可编程着色硬件的加入,使得Sandy-Bridge在视频转码等方面的具有独特的优势。
不过也可以看到,英特尔只在部分E3中提供了集成显卡,另一部分则没有——很显然对于想用独立显卡的用户来说,可以选择这部分没有GPU部分的CPU,以获得更高的计算性能。而原定于2011年底发布的Sandy-Bridge至强E5系列处理器,则延期到了2012年第一季度发布。从目前得到的数据来看,面向主流服务器市场的至强E5是不会集成GPU的,其实际性能还是未知数。
亲,盘点到这里至强家族的主要产品就说完了,零散信息肯定有诸多不全面的地方,但是相应要点基本都说到了。想了解未来英特尔至强E5系列处理器的动向么?2013年英特尔将切换至22nm制程工艺哟,Ivy-Bridge架构出路器将粉末登场,而更遥远的2014年,22nm工艺下的全新Haswell架构也会降世临凡。亲,期待您跟随ZDNet服务器频道共同鉴证哟。
附送亲一个礼物: