扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共8页)
目前我们还没有获得有关POWER7的一些典型高性能应用软件的测试成绩,而只有SPEC的OpenMP的基准测试成绩,所以在此仅做一简单的比较。
OpenMP基准性能测试
从成绩数值上看,4插槽至强7560的OpenMP的性能要好于4插槽的Power 750和755,不过两者评测时的线程负载并不一样,可见128个线程OpenMP的线程并没有帮助Power 750获得更好的成绩,这也从侧面说明单核心4线程的SMT设计对于POWER7的HPC应用并不是一个很好的方案,但不知道主频提高到3.8GHz时会有怎样的表现。不过当进行极端优化后的Peak(峰值)测试成绩,Power 755则与未打开Turbo模式的至强X7560相差无几了。
STREAM Benchmark测试成绩(TRIAD)
STREAM Benchmark是一款非常著名的持续内存带宽基准测试程序,在这项测试中4插槽的Power 755的成绩为121GB,而皓龙6100表现不错,达到了110GB,不过这个成绩是AMD自己公布的,在Anandtech网站的测试中,双插槽6174的成绩在50GB/s左右,4插槽理论上也就是100GB/s,但与4插槽的至强7500相比还是有明显的优势。Anandtech网站所测试的至强7500平台是双插槽的Dell PowerEdge R810,成绩为24GB/s,但Anandtech网站说英特尔工程师表示双插槽的至强7500最高达到29GB/s的STREAM Benchmark成绩,所以笔者最后推测4插槽的至强7560的成绩为58GB/s。
可能有读者会问为什么POWER7的内存带宽那么高,成绩并不比皓龙6100强多少,而至强7500比皓龙6100内存带宽规格没差多少,但为什么在测试中会成绩明显偏低呢?原因在于POWER7与至强7500在内存写入带宽上都有所缩小。其中POWER7的内存写入带宽是读取带宽的一半(写入数据位宽是读取数据位宽的1/2),理论为51.2GB/s,但8个通道的DDR3-1066则为68.2GB/s,这就出现了写入性能的瓶颈。而至强7500的单颗SMB的SMI南行数据通道为9条(从CPU的内存控制器发往DIMM),而北行数据通道为12条(从DIMM发往CPU内存控制器),所以SMB的读取带宽为9.6GB/s,写入带宽为7.2GB/s,而单通道DDR3-1066的写入带宽则为8.5GB/s,所以SMB在写入带宽上也存在瓶颈。反观皓龙6100,写入与读取带宽均相同为4通道DDR3-1333,约43GB/s,所以在内存读写综合效率上就占优了。
Anandtech网站给出的至强7500与皓龙6100的内和缓存的延迟、带宽测试数据
另一方面,由于至强7500引入了SMB的设计,虽然获得了极强的内存扩展能力,不过也在相应增加了内存的延迟,这也必然会对至强7500的内存性能产生一定的影响,但与所获得的内存扩展能力相比,对于高端企业级应用显然还是值得的。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者