扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
对于将要推出的Bulldozer架构,AMD公司仍然坚持严格保密的态度。最近该公司表示其新的FPU(浮点单元)将会被称为Flex FP,并且承诺将会带来高性能的计算性能,同时在尺寸及功耗方面将极具效率。
我们都知道,AMD Bulldozer处理器是由多个所谓的模块组成。每个模块将拥有2个整数引擎以及一个由"Flex FP" FPU双128-bit FMAC组成。另外就是根据AMD的介绍,FP与整数单元使用统一的调试器也会影响到效率。
AMD的服务器/工作站产品经理John Fruehe表示:“每个Flex FP均拥有自己的调度器,并不依赖整数调度器来调度FP指令,或者会使用整数资源来调度256-bit执行。这将有助于确保FP单元在浮点指令发生时保持完整。我们竞争对手的架构拥有一个单独调度器同时满足整数和浮点,这意味着无论整或者浮点指令都会受到单独的共享调度器的影响。”
当前的128-bit FPUs能够在一个并行的循环执行四条单精度指令或者2个双精度指令。而将要推出的AVX技术则可以在一个循环执行8条32-bit指令或者4条64-bit指令。
Flex FP的出彩之处在于其单个256-bit FPU可被2个整数核心共享。每一个循环任何一个核心将可以通过2条128-bit指令或者一条256-bit指令运行256 bits并行数据,或者每个整数核心能够同时执行128-bit指令。
“在当前典型的数据中心负荷中,大量的处理都是整数和较小部分的浮点。因此在大多数案例中,你并不会希望一个巨大的256-bit浮点单元占据了所有的核心空间以及所有的功耗,当整数核心处理所有的重担时在一旁看热闹。通过每2个核心共享一个256-bit浮点单元,我们可以减少核心尺寸以及功耗,从而有效降低购买成本和长期维护成本。”
在采用了共享Flex FP设计之后,处理器的功耗必然会出现下降。这也将会使得AMD能够在其中加入更多的整数核心。根据AMD的介绍,在采用了Flex FP设计后,待机时功耗仅为运行时的2%。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者