科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道服务器组件GPU通用计算:ATI向左NVIDIA向右?

GPU通用计算:ATI向左NVIDIA向右?

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

本文历数AMD与NVIDIA最近几代的GPU架构设计,并重点探讨了Fermi架构的设计,或许我们能从中理解两家厂商的不同理念以及他们对未来的发展设想。

来源:驱动之家 2009年12月31日

关键字: Fermi NVIDIA ECC

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共15页)

  11.提高可靠性 内存系统支持ECC纠错

  ECC全称是Error Checking and Correcting(错误检查与纠正),相比以往的奇偶校验技术ECC不仅能检查出错误还能自动纠正,提高了计算的可靠性,如果没有ECC校验人们需要计算出两次相同的结果之后才能确认计算成功。之前的GPU都不支持ECC技术,很难在商业计算中立足。Fermi的一大改进则是增加了ECC支持,而且核心内的register、cache和DRAM中都提供了ECC支持。

  普通用户对ECC或许没有什么概念,但是在商业计算上ECC却是不可或缺的功能,GT200虽然实现了双精度浮点运算,但是并没有支持ECC,所以使用GT200的Tesla 10系列服务器只适合做小规模的集群,要想真正冲击高性能计算机领域只有靠Fermi架构的服务器了。

Fermi与前两代架构中的存储系统的不同(图片来源于realwordtech)

  随着CUDA编译的程序越来越大,GT200中每SM单元16KB的共享内存已经不能满足需要,Fermi架构中每SM单元的可用内存/缓存提高到了64KB,而且配置方式非常灵活,既可以是48KB shard memory加16KB L1缓存也可以是16KB shard memory加48KB L1缓存,这样无论是对shard memory需求高或不高的程序都能从中受益。

  Fermi中的L2缓存容量达到了768KB,而且是所有SM单元共享的,每一个SM单元都能从中获得最新数据,实现了GPU内的高速数据共享。

  外部显存上,Fermi选择了GDDR5显存,拥有6条GDDR5内存控制,每条位宽为64-bit因此总位宽为384-bit,比GT200中的8条内存控制器512-bit位宽要少一些,不过GDDR5的传输速率要高于GDDR3,所以总带宽还有大幅增加,如果搭配1050MHz的GDDR5显存总带宽将达到201GB/s,显存容量也达到了1536MB,最高可达6GB。考虑到ECC显存不菲,桌面级Fermi可能去掉ECC支持。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章