扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共15页)
15.总结
统一渲染器的出现为GPU开拓新的应用领域提供了一个发展契机,AMD与NVIDIA在如何实现统一渲染器的设计上也走了不同的道路,AMD改进SIMD架构设计出的5路超标量胜在实现难度小,占用晶体管数量少,虽然处理标量运算效率低,但是可以通过大幅提升流处理器单元的数量来弥补可能的性能劣势,所以我们可以看到AMD显卡从RV70的流处理器从RV670的320个基础上提高到800个,Cypress架构又再次翻番达到惊人的1600个。NVIDIA则采取了另外一条路,每个流处理器不再区分标量或矢量,全部按1D标量计算,因此显卡的计算效率很高,通用性较好,缺陷则是设计复杂,晶体管规模庞大。
双方更深层的不同还是显卡未来的发展方向,要理解这一点需要我们先确认两家公司业务上的不同。AMD收购ATI之后同时拥有了GPU和CPU业务,他们更愿意组合GPU和CPU的优势互相促进产品的销量,无论哪一个产品的销量好都能做到旱涝保收,他们并不乐见GPU抢占CPU的功能,所以对于GPU通用计算并不热心。反观NVIDIA,它的业务起家于GPU,但是将GPU的未来完全寄托于游戏显卡上是很危险的,3D技术发展到现在已经很难在画质上一次次地革命,消费者并不会为了一点画质改进就不断升级显卡,而且游戏主机也在不断侵蚀PC游戏的地盘,NVIDIA显然不能将显卡的未来全部放在游戏这一个篮子里,开发GPU的通用计算功能进而进军其他领域也就是水到渠成的事了。
与NVIDIA有着相似眼光的还有业界大腕Intel,不过Intel没有独立的GPU业务,擅长的X86处理器,所以Intel的如意算盘则是用精简后的X86指令抢占GPU的通用计算业务,Larrabee项目就是关键的棋子。Larrabee并非简单的游戏显卡(当然,这也会是它的目的之一),它的指令集源于精简后的X86指令,通用性更强。除了Intel可能推出的自有API之外,Larrabee也会支持目前开放的OpenCL、DirectX等标准。Larrabee不成功则已,一旦其性能达到一定水准,凭借Intel的生产能力和资金实力,AMD和NVIDIA的GPU业务都会受到巨大冲击。不过值得他们庆幸的是Larrabee的进展并不是那么顺利,第一代产品已经取消,后续产品可能要到2010年底才会发布。
本文用大篇幅回顾了DX10以来AMD与NVIDIA在显卡设计上的不同,对Fermi更是着墨众多,除了Fermi还未发布其身上的神秘之处颇多之外,更主要的是Fermi肩负双重使命,一是要终结AMD在DX11显卡上的一家独大局面,扭转目前被压制的颓势,毕竟这一年来NVIDIA没有实质意义上的新产品发布,仅靠马甲战略维持场面。Fermi的第二项重任则是继续开拓通用计算市场并最终分得一杯羹。经历G80/GT200两代产品的有益尝试之后,Fermi架构可以说是专为高性能计算而生,ECC纠错支持、PTX2.0指令、高速并行线程处理、完整的C++支持都是针对HPC(高性能计算机)需求而设计。
明年1季度发布的怪兽Fermi能否带来惊喜?
尽管面临的困难重重,Fermi依然要背水一战。NVIDIA通过Fermi是守得云开见月明亦或是折戟沉沙铁未销暂时无人得知。
Good luck,Fermi.
参考:
1. NVIDIA_Fermi_Compute_Architecture_Whitepaper
2. Anandtech:NVIDIA's Fermi: Architected for Tesla, 3 Billion Transistors in 2010
3. Realwordtech:Inside Fermi: Nvidia's HPC Push
4. techreport:Inside Fermi's graphics architecture
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者