GPU通用计算：ATI向左NVIDIA向右？

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

本文历数AMD与NVIDIA最近几代的GPU架构设计，并重点探讨了Fermi架构的设计，或许我们能从中理解两家厂商的不同理念以及他们对未来的发展设想。

来源：驱动之家 2009年12月31日

　　15.总结

　　统一渲染器的出现为GPU开拓新的应用领域提供了一个发展契机，AMD与NVIDIA在如何实现统一渲染器的设计上也走了不同的道路，AMD改进SIMD架构设计出的5路超标量胜在实现难度小，占用晶体管数量少，虽然处理标量运算效率低，但是可以通过大幅提升流处理器单元的数量来弥补可能的性能劣势，所以我们可以看到AMD显卡从RV70的流处理器从RV670的320个基础上提高到800个，Cypress架构又再次翻番达到惊人的1600个。NVIDIA则采取了另外一条路，每个流处理器不再区分标量或矢量，全部按1D标量计算，因此显卡的计算效率很高，通用性较好，缺陷则是设计复杂，晶体管规模庞大。

　　双方更深层的不同还是显卡未来的发展方向，要理解这一点需要我们先确认两家公司业务上的不同。AMD收购ATI之后同时拥有了GPU和CPU业务，他们更愿意组合GPU和CPU的优势互相促进产品的销量，无论哪一个产品的销量好都能做到旱涝保收，他们并不乐见GPU抢占CPU的功能，所以对于GPU通用计算并不热心。反观NVIDIA，它的业务起家于GPU，但是将GPU的未来完全寄托于游戏显卡上是很危险的，3D技术发展到现在已经很难在画质上一次次地革命，消费者并不会为了一点画质改进就不断升级显卡，而且游戏主机也在不断侵蚀PC游戏的地盘，NVIDIA显然不能将显卡的未来全部放在游戏这一个篮子里，开发GPU的通用计算功能进而进军其他领域也就是水到渠成的事了。

　　与NVIDIA有着相似眼光的还有业界大腕Intel，不过Intel没有独立的GPU业务，擅长的X86处理器，所以Intel的如意算盘则是用精简后的X86指令抢占GPU的通用计算业务，Larrabee项目就是关键的棋子。Larrabee并非简单的游戏显卡（当然，这也会是它的目的之一），它的指令集源于精简后的X86指令，通用性更强。除了Intel可能推出的自有API之外，Larrabee也会支持目前开放的OpenCL、DirectX等标准。Larrabee不成功则已，一旦其性能达到一定水准，凭借Intel的生产能力和资金实力，AMD和NVIDIA的GPU业务都会受到巨大冲击。不过值得他们庆幸的是Larrabee的进展并不是那么顺利，第一代产品已经取消，后续产品可能要到2010年底才会发布。

　　本文用大篇幅回顾了DX10以来AMD与NVIDIA在显卡设计上的不同，对Fermi更是着墨众多，除了Fermi还未发布其身上的神秘之处颇多之外，更主要的是Fermi肩负双重使命，一是要终结AMD在DX11显卡上的一家独大局面，扭转目前被压制的颓势，毕竟这一年来NVIDIA没有实质意义上的新产品发布，仅靠马甲战略维持场面。Fermi的第二项重任则是继续开拓通用计算市场并最终分得一杯羹。经历G80/GT200两代产品的有益尝试之后，Fermi架构可以说是专为高性能计算而生，ECC纠错支持、PTX2.0指令、高速并行线程处理、完整的C++支持都是针对HPC（高性能计算机）需求而设计。