扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共4页)
Opteron 6200与6100、英特尔的SandyBridge之间的浮点处理模式的对比
简单来说,这种两个128bit单元弹性组合的方式,提供了有多种指令处理的模式,比如对于同时执行两个128bit的AVX指令,SandyBridge单一的256bit FP单元就不行了,而Flex FP则可以,同样的,这也适用于SSE指令。所以,AMD强调,除非是256bit的AVX指令环境,否则6200的单周期浮点处理能力是SandyBridge的两倍,显然灵活的可分拆也可组合的Flex FP功不可没。
Opteron 6200除了具备与英特尔SandyBridge相同的指令集外,还独家提供了两套指令集
目前主流的编译器大多已经支持AMD的FMA4和XOP指令集
而为了发挥Flex FP的强大的威力,AMD也专门开发了两套针对浮点运算的指令集FMA4与XOP,两者可以说都是为高性能计算所服务,但侧重点不太相同,FMA4更有针 对性,比如向量和矩阵计算、多项式评估、数据信号处理等,而XOP则针对数学、多媒体应用等。目前,主流的编译器大多已经全部或部分支持AMD的新指令 集,因此在发挥Bulldozer的浮点威力方面,还是很让人期待的。
新一代Opteron 6200/4200的主要特性
说完主要的处理架构的亮点外,我们再来看看其他方面的改。AMD强调了新一代处理器在三个方面的灵活性优势,分别是处理性能的灵活性,能耗的灵活性与平台及虚拟化的灵活性。而相较上一代的6100处理器平台,我认为前两者的改进最为明显。
Opteron 6200与6100对比,请注意整数处理的每周期发射数的提高(预示整数性能提升更明显)、Turbo CORE超频、C6能耗控制等新的变化
每个核心都有6个能耗/性能等级(P-States),可以根据TDP的设定而将最高性能限制在某一等级之下,而当与TurboCORE技术相配合时,我们能发现又多出两个等级,以提供最强的核心性能。在Opteron 6200平台上,用户可以在BIOS中通过AMD新推出的TDP Power Cap功能设定总功耗限制,而P-States也就会做出相应的限定,目前可达到的调节精度为1W,以保证尽可能的利用好最大的可允许功率
新增加的C6能耗控制状态,在这一状态,空闲的模块可以单独进入C6状态,此时模块停止供电与时钟信号,从而可最多节省95%的能耗。在Bulldozer处理器,每个模块的状态将保存在内存中
AMD TurboCORE技术实现了类似于英特尔“睿频”(TurboBoost)的功能
我们已经对英特尔的“睿频”技术有所了解,它可以在处理器的能耗不超出TDP功率限制的前提下,根据应用的性能需求,提升处理器核心的运行频率以最大限度挖掘核心的处理性能,而在Opteron 6200上也同样具备了这一能力,它就是AMD 的TurboCORE技术,它可分为两个模式。一种是All Core模式,所有的模块都可以提升300至500MHz的主频,另一种是Max Turbo,即如果一些轻负载线程让一半的模块可以将进入C6状态,但余下的模块又需要最大的处理性能,此时可以在All Core的基础上再增加500MHz(即最高可超频1GHz)。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者