扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共15页)
11.提高可靠性 内存系统支持ECC纠错
ECC全称是Error Checking and Correcting(错误检查与纠正),相比以往的奇偶校验技术ECC不仅能检查出错误还能自动纠正,提高了计算的可靠性,如果没有ECC校验人们需要计算出两次相同的结果之后才能确认计算成功。之前的GPU都不支持ECC技术,很难在商业计算中立足。Fermi的一大改进则是增加了ECC支持,而且核心内的register、cache和DRAM中都提供了ECC支持。
普通用户对ECC或许没有什么概念,但是在商业计算上ECC却是不可或缺的功能,GT200虽然实现了双精度浮点运算,但是并没有支持ECC,所以使用GT200的Tesla 10系列服务器只适合做小规模的集群,要想真正冲击高性能计算机领域只有靠Fermi架构的服务器了。
Fermi与前两代架构中的存储系统的不同(图片来源于realwordtech)
随着CUDA编译的程序越来越大,GT200中每SM单元16KB的共享内存已经不能满足需要,Fermi架构中每SM单元的可用内存/缓存提高到了64KB,而且配置方式非常灵活,既可以是48KB shard memory加16KB L1缓存也可以是16KB shard memory加48KB L1缓存,这样无论是对shard memory需求高或不高的程序都能从中受益。
Fermi中的L2缓存容量达到了768KB,而且是所有SM单元共享的,每一个SM单元都能从中获得最新数据,实现了GPU内的高速数据共享。
外部显存上,Fermi选择了GDDR5显存,拥有6条GDDR5内存控制,每条位宽为64-bit因此总位宽为384-bit,比GT200中的8条内存控制器512-bit位宽要少一些,不过GDDR5的传输速率要高于GDDR3,所以总带宽还有大幅增加,如果搭配1050MHz的GDDR5显存总带宽将达到201GB/s,显存容量也达到了1536MB,最高可达6GB。考虑到ECC显存不菲,桌面级Fermi可能去掉ECC支持。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者