至顶网›服务器频道 ›服务器组件›NVIDIA Fermi(GT300)通用计算架构探秘

NVIDIA Fermi(GT300)通用计算架构探秘

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

AMD Cypress(RV870)拉开了DX11时代的序幕，NVIDIA Fermi(GT300)正在掀起新的浪潮。今天凌晨，NVIDIA在GPU技术会议上终于揭开了全新架构的秘密，并首次展示了新一代显卡。

来源：驱动之家 2009年11月17日

关键字： NVIDIA Fermi

在本页阅读全文(共8页)

　　四、Fermi架构解析

　　1、SP、SM

　　从高层次上看，Fermi和GT200结构形似，并无太大不同，但往深处看就会发现绝大部分都已经进化。

　　最核心的流处理器(Streaming Processor/SP)现在不但数量大增，还有了个新名字CUDA核心(CUDA Core)，由此即可看出NVIDIA的转型之意，不过我们暂时还是继续沿用流处理器的说法。

　　所有流处理器现在都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法，而后者在过去只是模拟的，事实上仅能计算24-bit整数乘法；同时全面引入的还有积和熔加运算(Fused Multiply-Add/FMA)，每循环操作数单精度512个、单精度256个(G200仅支持单精度FMA)。所有一切都符合业界标准，计算结果不会产生意外偏差。

　　双精度浮点(FP64)性能大大提升，峰值执行率可以达到单精度浮点(FP32)的1/2，而过去只有1/8，AMD现在也不过1/5，比如Radeon HD 5870分别为单精度2.72TFlops、双精度544GFlops。由于最终核心频率未定，所以暂时还不清楚Fermi的具体浮点运算能力(双精度预计可达624GFlops)。