科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道服务器组件GPU通用计算:ATI向左NVIDIA向右?

GPU通用计算:ATI向左NVIDIA向右?

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

本文历数AMD与NVIDIA最近几代的GPU架构设计,并重点探讨了Fermi架构的设计,或许我们能从中理解两家厂商的不同理念以及他们对未来的发展设想。

来源:驱动之家 2009年12月31日

关键字: NVIDIA AMD GPU R600

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共15页)

  4.R600接踵而至 AMD首代DX10架构出师不利

  NVIDIA推出G80架构时,AMD与ATI正忙于双A合并的事宜,AMD推出的第一代DX10架构的显卡依然是原先ATI负责的。在晚了NVIDIA将近半年之后,AMD于2007年5月份发布了基于R600架构的HD 2000系列显卡,由于AMD与NVIDIA在统一渲染器设计上的思路不同,R600的问世也让人们有机会对比A、N两家的不同。

R600核心架构设计图

  承前文所述,AMD的统一渲染器设计在原来的SIMD架构上改良而来,Superscalar超标量架构由1个4D矢量一个1D标量运算核心组成,进行传统的4D矢量运算时效率最高,而遇到1D标量运算时运算效率降至四分之一,所以需要更多数量的流处理器来弥补这个劣势。R600架构中设计了320个流处理器单元,分为四个SIMD阵列,每个阵列又可分为两组,每组40个sp单元。每阵列的80个sp中又分为16个小单元,每一组都是由5个流处理器和一个分支预测单元。

  具体方式如下图所示:

AMD显卡中每一个流处理器的详细结构

  这张图也可以解释为什么AMD与NVIDIA显卡中流处理器数目差异如此之大,AMD所称的流处理器实际上是由5个小单元组成,所以通常称AMD显卡的中流处理器为流处理器单元,而NVIDIA显卡才成为流处理器,换算一下的话两者是5:1的关系。这个比列只是一种近似比较,实际性能还要考虑各自的频率以及效能。

R600的纹理单元

  R600内设计了四个纹理单元,正好对应SIMD阵列的数目。每组纹理单元拥有4个纹理过滤单元和8个纹理寻址单元,因此共有16个纹理过滤单元,32个纹理寻址单元。

HD 2000系列首度支持Hardware Tessellation技术

  在R600架构的显卡上还有两项技术值得一提,第一个则是Hardware Tessellation,也就是目前DX11中火热的硬件曲面细分技术,AMD在HD 2000显卡中引入了这一技术,不过当时的硬件环境远不成熟,Hardware Tessellation不具有实用性,只在HD 2000显卡上昙花一现,到了HD 3000系列就去掉了。

AMD的环形总线技术

  另外一个则是1024-bit环形总线技术,2900XT本身就拥有512bit显存位宽,已经是当时位宽最大的,G80最大位宽也不过384-bit。AMD在此基础上又引入了Ring bus环形总线,可以等效1024-bit位宽,如果使用高速的GDDR4显存,那么显存带宽可以轻易突破130GB/s(这一数值在今天的高端显卡上也不容易达到),普通的GDDR3显存带宽也有100GB/s以上的带宽。可惜的是当时的生产工艺还是80nm,512-bit的显存位宽要占据相当大的晶体管规模,AMD的环形总线技术也没有普及开来,到HD 3000系列上甚至精简为256-bit,但是搭配高速GDDR3显存来弥补。

  R600作为AMD推出的第一代统一渲染架构在虽然亮点多多,但是在市场上并没有引起玩家的共鸣,性能上相对NVIDIA的G80并没有胜算,很快就被改进版的RV670架构所取代。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章