扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共5页)
● Bulldozer性能提高80%
负责Bulldozer开发的AMD首席技术官Chuck Moore曾在2005年的AMD分析日上提到了集群化架构的优点,只是增加50%的CPU内核资源,吞吐量提升80%。根据这个说明,和Hyper-Threading一样的SMT资源和性能也有一些提升。
CPU资源增加50%,性能增加80%
Moore在这次分析日上再次提到这种架构可以提高吞吐量达80%。同时,AMD也把这种集群化架构申请了多项专利(United States Patent Application 20090006814、20090024836等)。
下图是Bulldozer的具体结构,可以看到一个Bulldozer有2个证书运算的内核,每个内核有4个整数运算通道。4个通道内,2个ALU和AGU为一组,而现在AMD的架构是3个ALU和AGU为一组,最大能实现3个x86整数运算命令。如果是4个ALU和AGU一组的话,那么一个整数运算内核要比现有CPU内核大,如果是2个ALU和AGU一组的话,大约是现有内核的2/3。
Bulldozer架构(点击放大)
Bulldozer的具体结构
Bulldozer模块的指令获取和解码,每个周期可处理4条指令,而计算指令与在寄存器操作的x86指令会被分成8个内部微操作指令(uOPs),整数运算管道中ALU和AGU则两两成对,正好吻合。
在浮点运算单元方面,则准备了两个整合的128bit SIMD单元,这将兼容英特尔的256bit AVX指令集,AVX将在这两个128bit SIMD单元中执行。AMD已经确定改变了原有在Bulldozer上的SSE5计划,将支持英特尔的256bit的SIMD指令集AVX。而对于浮点运算单元来说,每个时钟循环中都可以在两个处理器核心之间单独或共享使用。
AMD命令扩张的变更
AVX格式的命令也加入进来(点击放大)
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者