扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共15页)
4.R600接踵而至 AMD首代DX10架构出师不利
NVIDIA推出G80架构时,AMD与ATI正忙于双A合并的事宜,AMD推出的第一代DX10架构的显卡依然是原先ATI负责的。在晚了NVIDIA将近半年之后,AMD于2007年5月份发布了基于R600架构的HD 2000系列显卡,由于AMD与NVIDIA在统一渲染器设计上的思路不同,R600的问世也让人们有机会对比A、N两家的不同。
R600核心架构设计图
承前文所述,AMD的统一渲染器设计在原来的SIMD架构上改良而来,Superscalar超标量架构由1个4D矢量一个1D标量运算核心组成,进行传统的4D矢量运算时效率最高,而遇到1D标量运算时运算效率降至四分之一,所以需要更多数量的流处理器来弥补这个劣势。R600架构中设计了320个流处理器单元,分为四个SIMD阵列,每个阵列又可分为两组,每组40个sp单元。每阵列的80个sp中又分为16个小单元,每一组都是由5个流处理器和一个分支预测单元。
具体方式如下图所示:
AMD显卡中每一个流处理器的详细结构
这张图也可以解释为什么AMD与NVIDIA显卡中流处理器数目差异如此之大,AMD所称的流处理器实际上是由5个小单元组成,所以通常称AMD显卡的中流处理器为流处理器单元,而NVIDIA显卡才成为流处理器,换算一下的话两者是5:1的关系。这个比列只是一种近似比较,实际性能还要考虑各自的频率以及效能。
R600的纹理单元
R600内设计了四个纹理单元,正好对应SIMD阵列的数目。每组纹理单元拥有4个纹理过滤单元和8个纹理寻址单元,因此共有16个纹理过滤单元,32个纹理寻址单元。
HD 2000系列首度支持Hardware Tessellation技术
在R600架构的显卡上还有两项技术值得一提,第一个则是Hardware Tessellation,也就是目前DX11中火热的硬件曲面细分技术,AMD在HD 2000显卡中引入了这一技术,不过当时的硬件环境远不成熟,Hardware Tessellation不具有实用性,只在HD 2000显卡上昙花一现,到了HD 3000系列就去掉了。
AMD的环形总线技术
另外一个则是1024-bit环形总线技术,2900XT本身就拥有512bit显存位宽,已经是当时位宽最大的,G80最大位宽也不过384-bit。AMD在此基础上又引入了Ring bus环形总线,可以等效1024-bit位宽,如果使用高速的GDDR4显存,那么显存带宽可以轻易突破130GB/s(这一数值在今天的高端显卡上也不容易达到),普通的GDDR3显存带宽也有100GB/s以上的带宽。可惜的是当时的生产工艺还是80nm,512-bit的显存位宽要占据相当大的晶体管规模,AMD的环形总线技术也没有普及开来,到HD 3000系列上甚至精简为256-bit,但是搭配高速GDDR3显存来弥补。
R600作为AMD推出的第一代统一渲染架构在虽然亮点多多,但是在市场上并没有引起玩家的共鸣,性能上相对NVIDIA的G80并没有胜算,很快就被改进版的RV670架构所取代。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者