科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航



ZDNet>服务器频道>芯片>AMD明确下一代Bulldozer微架构计划

AMD明确下一代Bulldozer微架构计划

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

AMD在美国时间11月11日召开了面向分析师的“2009 Financial Analyst Day”大会。在这次大会上,AMD公布了下一代CPU架构“Bulldozer”和对抗Atom的低功率CPU架构“Bobcat”,正式明确了Bulldozer将采用最强性能的多线程技术。

来源:ZDNet编译 2009年11月16日

关键字:AMD Bulldozer Llano

● AMD分析日展示新技术

AMD在美国时间11月11日召开了面向分析师的“2009 Financial Analyst Day”大会。在这次大会上,AMD公布了下一代CPU架构“Bulldozer”和对抗Atom的低功率CPU架构“Bobcat”,正式明确了Bulldozer将采用最强性能的多线程技术。

同时,AMD还公布了同时集成了CPU和GPU两部分、代号为“Llano”的APU(加速处理器)。AMD明确介绍了CPU路线图,适合上网本市场的Brazos采用了代号为“Ontario”的APU单元,基于“Bobcat”架构。在GPU新品方面,AMD将在下周发布R800系列的Hemlock高端GPU,另外还提到了将在2010年发布DirectX 11显卡的移动版本产品(代号为Broadway)。

Llano的印模(点击放大)

● Bulldozer集群化的微架构

这次大会上AMD终于明确了将在2011年投入生产下一代微架构Bulldozer。Bulldozer是面向服务器和桌面的CPU,独立于之前的K8和K10架构,是一款全新开发的架构,采用32nm SOI工艺制作。

AMD还谈到了Bulldozer集群化的微架构。Bulldozer集群化的微架构就是CPU内核的集群化。具体来说是融合了两个CPU内核,两个内核共享浮点运算单元和命令解码器等资源。

AMD将融合了两个内核的Bulldozer架构称之为“Bulldozer Module”,基本单位是两线程并列的组件。由于Bulldozer聚合了多个单元,所以可实现多核架构。例如,要是4核Bulldozer CPU的话,可以装载2个Bulldozer Module。

Bulldozer的集群化微架构可以在一个组件内同时实现2个线程。这种在一个CPU内实现双线程的技术看上和Intel的Hyper-Threading有些类似,其实是有很大不同的。

Intel的Hyper-Threading(超线程)可以使操作系统或者应用软件的多个线程,同时运行于一个超线程处理器上,其内部的两个逻辑处理器共享一组处理器执行单元。而AMD CPU的两个线程使用各自的单元,但两个线程是共享命令解码器和浮点运算等资源的。因为是整数运算,所有线程之间没有冲突,因此吞吐量有所提高。

Bulldozer架构

● Bulldozer性能提高80%

负责Bulldozer开发的AMD首席技术官Chuck Moore曾在2005年的AMD分析日上提到了集群化架构的优点,只是增加50%的CPU内核资源,吞吐量提升80%。根据这个说明,和Hyper-Threading一样的SMT资源和性能也有一些提升。

CPU资源增加50%,性能增加80%

Moore在这次分析日上再次提到这种架构可以提高吞吐量达80%。同时,AMD也把这种集群化架构申请了多项专利(United States Patent Application 20090006814、20090024836等)。

下图是Bulldozer的具体结构,可以看到一个Bulldozer有2个证书运算的内核,每个内核有4个整数运算通道。4个通道内,2个ALU和AGU为一组,而现在AMD的架构是3个ALU和AGU为一组,最大能实现3个x86整数运算命令。如果是4个ALU和AGU一组的话,那么一个整数运算内核要比现有CPU内核大,如果是2个ALU和AGU一组的话,大约是现有内核的2/3。

Bulldozer架构(点击放大)

Bulldozer的具体结构

Bulldozer模块的指令获取和解码,每个周期可处理4条指令,而计算指令与在寄存器操作的x86指令会被分成8个内部微操作指令(uOPs),整数运算管道中ALU和AGU则两两成对,正好吻合。

在浮点运算单元方面,则准备了两个整合的128bit SIMD单元,这将兼容英特尔的256bit AVX指令集,AVX将在这两个128bit SIMD单元中执行。AMD已经确定改变了原有在Bulldozer上的SSE5计划,将支持英特尔的256bit的SIMD指令集AVX。而对于浮点运算单元来说,每个时钟循环中都可以在两个处理器核心之间单独或共享使用。

AMD命令扩张的变更

AVX格式的命令也加入进来(点击放大)

● 首款APU Llano终于揭开神秘面纱

AMD在这次大会上明确了集成CPU和GPU的Llano APU产品计划,采用Llano的笔记本电脑和台式机产品将在2011年面世,并采用32nm SOI制造工艺。Llano在 一个印模上集成了CPU内核和4个DirectX 11 GPU内核,每个APU均采用了技术成熟的CPU和GPU。因此,2011年面世的Llano不管是CPU还是GPU都不会是当时的最尖端技术。

GPU和CPU的集成

Llano是AMD首款集成了CPU和GPU的CPU产品

这次AMD还公布了Llano的印模结构,下图是Llano与Athlon II X4 Propus的比较图。两者的CPU内核结构大体上相同,而且按照缩小的CPU内核尺寸推定,Llano和Propus的印模尺寸(面积)也是大体上相同的。

Llano和Propus的印模尺寸大体上相同(点击放大)

这样,如果采用32nm制造工艺,按照集成4个GPU内核计算的话,它的价格大约在100美元上下。下图是同样采用了32nm且集成GPU的Intel Sandy Bridge进行比较。

Llano和Sandy Bridge的印模尺寸比较(点击放大)

Llano和Sandy Bridge的GPU内核大小基本相同,内存控制器也几乎是一样的,Sandy Bridge的缓存较大一些,而且CPU内核大很多。因此估计Sandy Bridge在尺寸上要比Llano大一圈。

Llano的主要特点

● AMD更新CPU和GPU的路线图

AMD这次还更新了CPU的发展路线图。就路线图本身来说与2008年在分析日上公布的没有重大变化,只是细微部分更加明确了。AMD将在2011年发布采用Bulldozer、代号为Zambezi的CPU,去年采用的代号是“Orochi”。基于Bulldozer的Zambezi可以达到4或者是8核心的处理器。代号为“Scorpius”的平台也将采用新一代GPU架构。主流桌面平台则是“Lynx”,将基于新的Llano APU。

2011年面向主流笔记本电脑、基于Llano APU的“Sabine”平台也将亮相,另外还有适合上网本和超薄笔记本的Bobcat架构。

在服务器方面,AMD计划在2011年推出基于“Bulldozer”核心的“Interlagos”12和16核心处理器,将采用32纳米制程技术制造,并可支持 “Maranello”平台。皓龙6000系列的Maranello针对双路和4路服务器而设计。

AMD还将在2011年年推出6核或8核的Valencia,支持皓龙4000系列的支持“San Marino”平台。适合2路或者4路的“Fiorano”和适合1路的AM2基本没有什么变化。

笔记本电脑平台的路线图

桌面平台的路线图

高端桌面的平台

主流桌面的平台

主流笔记本电脑的平台

面向超薄笔记本电脑的平台

面向服务器平台的路线图

GPU将向着DirectX 11代的R800系列结构快速推进。除了近期将公布的双GPU“Hemlock”之外,AMD还将在明年第一季度推出面向主流的“Redwood”和“Cedar”,另外适合移动平台的DirectX 11系列也将在明年第一季度登场,该系列预计将采用纽约曼哈顿地区的街名,“Broadway”(百老汇)、“Madison”(麦迪逊)和“Park”(公园)。

GPU路线图

AMD CPU印模尺寸的推进图(点击放大)

印模尺寸的推定

综合评分:8.07 分
云能力:7.1 分
营业额:54.2亿美元[2012]
云服务:AMD虚拟化

查看更多 >>

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅ZDNet技术邮件将是您的最佳途径之一。