扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共7页)
● 强大的浮点运算单元
在共享浮点运算单元的同时,AMD还让浮点运算单元更加高效。
Akrout表示:“我们将浮点运算单元作为贡献的资源,这样以灵活地进行共享。2个整数运算单元可以同时分别作为浮点运算单元的一部分。或者,其中一个整数运算单元可以占用浮点运算单元。”
对于浮点运算单元来说,并行线程的执行似乎可以在一个单元内完成。而且,AMD更进一步,让浮点运算单元更加强大。
Patla表示:“为了让浮点运算单元成为最高效的共享资源,我们维持了它较大的容量——2个128位的FMAC。如果使用的话速度和效率将非常高。”
总之,Bulldozer中浮点运算单元成为共享的资源,由于进一步完善,它可以发挥更高的性能。尽管AMD在谈到Bulldozer的时候解释了浮点元算性能的提升,但是原因是显而易见的。而且,AMD认为通用CPU编入SIMD单元的向量长度以单精度4路(128位)为宜,而Intel则认为单精度则打算向单精度4路(256位)扩展。
有趣的是,一般整数预算单元与浮点运算单元的比例是2:1。例如,Sun的Niagara2(UltraSPARC T1/UltraSPARC T2)和Rock也是采用2个整数内核和1个共享浮点内核的比例。同时,以前DEC/Compaq基于Alpha处理器的EV8也是由8个整数运算单元和4个浮点运算单元构成。一般认为,CPU采用这个比例是为了追求多线程性能,同时提高多线程的效率。顺便一下,EV8的工程师Joel Emer现在就职于Intel架构群组。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者