科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道服务器组件GPU通用计算:ATI向左NVIDIA向右?

GPU通用计算:ATI向左NVIDIA向右?

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

本文历数AMD与NVIDIA最近几代的GPU架构设计,并重点探讨了Fermi架构的设计,或许我们能从中理解两家厂商的不同理念以及他们对未来的发展设想。

来源:驱动之家 2009年12月31日

关键字: NVIDIA AMD

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共15页)

  6.规格翻倍 RV770赢得双丰收

  真正给AMD带来生机的是HD 4800系列显卡。在HD 3800系列显卡身上找到新思路之后,AMD又于2008年6月分发布了RV770架构的第二代DX10.1显卡,显卡的流处理器单元从上代的320个暴增到800个,AMD显卡的架构容易增加流处理器单元的优势渐渐显现出来。

RV770架构图

  RV770的SIMD阵列由RV670的4组增加到10组,纹理单元也相应地增加到10组,整体规格是上一代架构的2.5倍,流处理器单元达到了800个,纹理处理器则提高到了40个,光栅单元(ROP)为16个,sp单元的急剧增加也大幅提升了HD 4800系列显卡的性能,至少可以抗衡NVIDIA的GeForce 9系显卡。

RV770的纹理单元做了改进

  对比前面的RV670架构可以看出RV770的几点不同:SIMD阵列排列方向横置,纹理单元紧靠流处理器单元。因为RV670架构在纹理性能上不尽如人意,AMD在RV770上改进了纹理单元的设计,虽然每个纹理单元的规格没有变化,但是效率更高,一个简单的例子就是开发者去掉用以保证纹理单元独立性的TMU Pool设计。

ROP单元

  RV770的光栅单元数量保持在RV670的16个,不过HD 4800系列显卡的抗锯齿性能明显要强于HD 3800系列,因为RV770的ROP单元Depth stencil ops(景深模板的每秒操作数)双倍于RV670,在执行2MSAA/4MSAA运算时每周期可填充16像素,8AA时每周期可填充8像素,都达到了RV670的两倍。 此外AMD之前引入过名为CFAA(Custom Filter Anti-Aliasing)的新算法,在使用CFAA的时候AMD的显卡还可以利用流处理器进行抗锯齿运算,800个流处理器最高可以达到24x CFAA。

  RV770最为成功的并非它的架构设计而是AMD的市场策略。通过对制程工艺的熟练掌握,RV770在规格翻了一倍多的同时并没有大幅增加核心面积(RV670为192平方毫米,RV770在256平方毫米),晶体管数量从6.6亿增加到9.56亿的同时功耗控制也非常出色(TDP功耗为110W,支持自动降频),所以RV770的成本很低,显卡上市价直接切入消费者的心理价,AMD的“Small die”策略赢得了市场成功。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章