扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNetChina服务器站 9月5日组件/芯片分析 处理器从早期的单核心发展到现在主流的双核心,其性能的提升和功耗的降低都有了质的飞跃,而四核心处理器也渐渐的走入了人们的视野。自去年英特尔首先宣布推出酷睿架构的四核心处理器后不久,AMD也向人们展示了其最新的四核心处理器——巴塞罗那。很显然,巴塞罗那比英特尔的酷睿四核处理器更能吸引人们的目光。
K8架构谢幕,K8L架构登场
尽管AMD K8架构在与英特尔NetBurst架构的交锋中占尽了上风,但随着英特尔Core架构的横空出世,让AMD在市场上的优势地位瞬间消失。2006年,是英特尔Core架构完胜的一年。面对英特尔Core的挑战,使得AMD不得不发布其K8架构的最新改进版本——K8L(K10),巴塞罗那就是AMD采用K8L架构的第一款产品。其实K8L并不是一个全新的架构,它可以说是在目前AMD x86-64架构的基础上改进而来的,它和当前Opteron的关系,就好比Core 2与PentiumM一样。
巴塞罗那工程示意图
K8L架构相对于K8架构来说,进行了多方面的改进和优化, AMD将近年来所取得的多项革新技术融入到目前的K8架构中,其架构的各个细节设计和技术均有了很大的进步,而K8L也将是K8架构的最终演化形态。尽管K8L架构没有巨大的革命性意义,但是基于原有架构的新设计将把其性能提升到一个崭新的高度,这对AMD而言有着很重要的意义。
巴塞罗那 首款原生四核处理器
巴塞罗那所采用的K8L架构其原始设计就是四核心,并且其四颗独立核心是集成在同一硅片上的,因此说巴塞罗那是原生四核处理器。作为K8L架构的第一款产品,巴塞罗那将会采用65nm制作工艺,同时还将引入IBM的Embedded Silcon Germanium和Stress Memorization这两项最新的电路技术,这两项电路技术可以有效的减少巴塞罗那处理器的电子迁移现象以及漏电率等负面影响。另外,AMD还可能使用更先进的PD-SOI技术或者FD-SOI技术从而进一步的降低巴塞罗那处理器的功耗,不过,从相关的资料来看,目前的PD-SOI技术仅仅能够阻止源极到基板的漏电,但对栅极漏电和源极到漏极的漏电没有任何防止作用,而且仅仅缩小源极与基板之间的接触电容,对导线电容和栅极电容则没有作用。由于SOI工艺制造步骤复杂,成本上升了15%以上,而在90nm工艺时的性能提高不到5%,因此FD-SOI技术对巴塞罗那性能的提升还有待市场的检验。
AMD首席销售与市场运营官比较Barcelona Opteron和Clovertown Xeon
除此之外,巴塞罗那仍将继续采用CMP(单芯片多核心处理器)设计思路(K8架构也采用了CMP设计思路)。CMP是指在一个芯片上集成多个微处理器核心,从实质上说,每个微处理器都是一个相对简单的单线程微处理器,而且多个核心间联系非常紧密,甚至共享L1、L2和L3等,其核心间通过高速总线连接在一起。而AMD在放弃了x86架构上一贯追求高主频的做法之后,借鉴了CMP的设计思路,将对更高带宽的支持引入到了x86架构中。同时通过独创的直连架构和超传输总线技术,将CPU直接连接到内存、I/O上。这种设计思路消除了传统的前端总线瓶颈,降低了内存访问延迟,使系统的性能有了明显的提升。
巴塞罗那引入四核共享L3缓存AMD的处理器架构一直在缓存容量上落后于Intel,早在K8架构上,AMD就通过在处理器内部整合内存控制器的方式来弥补缓存容量上的不足。而内存控制器也给AMD处理器带来了有目共睹的好处, K8架构仅依靠512KB的L2缓存就击败了当时的对手Pentium4,直到现在Athlon64 X2也依然保持着与英特尔Northwood相同的512KB二级缓存(Northwood早已被英特尔淘汰,目前的Core架构处理器其二级缓存一般都在2MB以上)。
相比于K8架构,巴塞罗那处理器的每个核心不仅拥有32KB+32KB的一级缓存、512KB的二级缓存,同时还增加了32路的2MB四核心共享三级缓存。巴塞罗那的L2缓存是作为L1缓存的备用空间,L1缓存储存着CPU当前最需要的数据,而当空间不足时,一些不是最重要的数据就转移到L2缓存中,而当未来再次需要时,则从L2缓存中再次转移到L1缓存中,新加入的L3缓存则延续了L2缓存的角色,四颗核心的L2缓存将溢出的数据暂时寄存在L3缓存中。
巴塞罗那缓存结构图
可以说,选择L3缓存是AMD处理器提升性能的一种方式。因为,如果加入大容量的L2缓存的话,相对而言会增加成本,而且还有一定的风险性,因为在处理器架构相同的前提下,更大的L2缓存可能无法提供预期的性能提升,所以AMD选择L3缓存,这也是一种折中的办法。不过,增加L3缓存给处理器带来的好处也是毋庸置疑的。首先,增加L3缓存可以显著提高CPU核心间的通信效率,在降低功耗和内存延迟的同时提高性能;其次,快速的32路L3缓存不仅可以更好的满足多任务并行,而且对单任务的执行也有着较大积极作用;最后,加L3缓存有效的避免了数据共享的瓶颈问题。
巴塞罗那提供了完整的SSE 128
巴塞罗那的另一项重要改进就是提供了同英特尔Core架构一样完整的128位SSE执行位宽。在K8构架中,AMD虽然做到了双路SSE执行单元,但是这两个SSE执行单元位宽仅是64位,这样在处理大量的128位SSE指令时,K8芯片就需要先把128位SSE、SSE2、SSE3中的矢量指令分解为两个64位宏指令,然后由其64位SSE执行单元分别处理后再合并,这对处理器的性能是有较大损失的。
巴塞罗那在拥有128位的SSE执行位宽之后,128位的SSE指令就不需要先分解再合并了,而是可以直接进行运算,其一个频率周期内可执行一个128位SSE指令。配合完整的128位SSE执行单元,以及庞大的
执行单元数目,巴塞罗那可在一个频率周期内,同时执行128位乘法、128位加法、128位数据加载与128位数据回存,或着是4个32位单倍浮点精确度乘法与4个32位单倍浮点精确度加法运算。
巴塞罗那SSE 128结构图
通过提供完整的128位SSE执行位宽,巴塞罗那在FPU、向量SSE数据的分派、传输、解码速度三方面同时达到现有K8v架构同频率处理器的两倍速度。同时,由于巴塞罗那的两条浮点数据传输带宽也增加到了128位,这使得处理器可以与L1缓存之间进行128位的高速传输。不仅如此,巴塞罗那在浮点FADD和FMUL中也将拥有128位的ADD/MUL块处理能力来面对SSE2数据。根据测试,我们了解到巴塞罗那K8L架构的浮点运算能力将至少比K8架构快一倍,甚至比当前最强大的Core架构处理器还要快10%。
引人关注的电源管理随着越来越多的用户开始关心电脑的硬件功耗问题,AMD在巴塞罗那的功耗控制方面采用了“独立核心动态调用(DICE)”四核心电源管理技术,DICE不仅会根据系统负载智能分配各核心需要执行的任务,还可以在核心处于空闲状态的时候将其转入完全休眠状态,从而大幅节省功耗。
巴塞罗那四核心及北桥各自拥有独立的PLL
由于每个处理核心、北桥等部件都具有自己独立的PLL和时钟频率,因此巴塞罗那能够比较好地协调其负载和功耗。根据AMD介绍,一核心100%负载、三核心33%负载时的功耗是全载时的60%,而一核心100%负载、一核心50%负载、两核心关闭的时候是全载时的45%。通过以上数据我们可以看到,巴塞罗那在提高性能的同时,仍保持了与双核相同的功耗水平。
巴塞罗那四核心全速运行时的状态
巴塞罗那在一核心100%负载、一核心50%负载、两核心关闭时的功耗,是全载时的45%
巴塞罗那在电源管理方面还采用了AMD的分隔电源层技术(Split Power Plane),分隔电源层技术可以使巴塞罗那处理器即使在内存控制器全速运行的时候,也可以降低处理器的核心电压。这使得服务于外部内存请求的内存控制器可以独立于处理器核心 p-state 状态的转换,实现更多的 p-state 状态,从而达到降低功耗的目的。
此外,巴塞罗那还通过逻辑电路设计提高了“时钟门控”的数量,支持自动关闭逻辑电路中的非工作区域,进一步节约能耗。其中“粗放门控”可以将闲置的整个逻辑电路块关闭,而“精微门控”则可以在适当的时候关闭某些逻辑电路片段。
巴塞罗那对虚拟化技术提供了硬件支持
AMD还增强了对虚拟化技术的硬件支持,最明显的改进就是将目前的影式分页技术变成了虚拟地址转换。在系统管理程序中运行多个客户操作系统的虚拟化软件堆栈中,由于每一个客户操作系统都有着自己独立的内存管理,所以需要处理一种新型的地址翻译操作,那就是客户系统地址到本地主系统管理程序地址的转换。具AMD声称,目前这种地址翻译靠的是一种叫做“影式分页”的软件加速方式处理。而巴塞罗那将更进一步为其提供硬件加速以代替原有的软加速“影式分页”技术,AMD称其新技术为“嵌套分页”。
AMD虚拟化技术架构图,其硬件控制部分就是HYpervisor
通常在运行虚拟系统时,系统管理程序要花费大约75%的时间来做影式分页。现在,由于硬件植入了主、客页面表格,从而无需再为这方面的工作耗费时间。此外,被翻译出来的地址还被保存在巴塞罗那的大容量TLB中以进一步提高性能。AMD指出巴塞罗那的“嵌套分页”无需软件商对软件做大的变动即可运行,只需设好“状态位”即可。
AMD处理器未来展望
K8L架构四核处理器巴塞罗那的推出,将使AMD在技术上继续和英特尔保持在同一水平线上。目前,巴塞罗那处理器将会采用65纳米技术,而到2008年下半年,AMD会将其K8L架构处理器过渡到45nm,这会使处理器内核的数量翻一倍(8个内核)。随着DDR3的逐渐走红,支持DDR3也将成为AMD处理器发展的必然趋势(DDR3相比DDR2有更低的工作电压,更高的频率和更快的速度), 因此AMD计划明年在其处理器中内置DDR3内存控制器,以实现对DDR3的支持。
AMD Opteron处理器路线图
根据目前的资料显示,代号为Budapest(布达佩斯)的完善版K8L核心将于今年秋末上市,支持Hyper-Transport 3.0以及更大容量的L3缓存,其型号将为Opteron 12XX系列以及ATHLON64全系列。而在2008年春季,代号为Shanghai(上海)的服务器版四核心处理器也将上市发布,届时代号为Shanghai(上海)的Opteron22XX以及82XX系列将会成为AMD最强的处理器,并且AMD还会在Shanghai(上海)中引入更多新的电路技术来控制其功耗等问题。
结束语
随着巴塞罗那上市日期的逐渐接近,作为K8架构的革新产品,巴塞罗那承载了太多的期望,人们希望巴塞罗那能够成为用户真正需要的产品,而Barcelona所带来的成本、性能、功耗等优势也能够为用户带来实实在在的效益。最后我们期望巴塞罗能够在硝烟弥漫的四核处理器战场上获得成功,并成为一款经典之作。