扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共4页)
Intel从很早就开始向一部分用户发售Larrabee的样品,让用户对其进行评估,然后获得反馈。所以,有人推测Intel修正Larrabee战略时间间隔的一个很大原因可能就是Intel得到了关于Larrabee作为图形芯片的糟糕反馈结果。
实际上,有消息称对Larrabee图形系统的评估并不理想。尤其是现有图形任务的性能效率非常糟糕。虽然我们并没有得到关于性能评价的细节,但是好像缺失存在效率方面的问题。
尤其是于GPU对比的话,每瓦能耗的性能相当地,因此据称它还不具备GPU的竞争力。有传闻称它的“性能/电力太低”。
从架构方面很容易想到会有这样的评价。
在这几个图形处理功能中,Larrabee唯一没有采用软件处理的功能是“纹理过滤”,因此,它在效率方面很难胜过那些对现有图形API进行硬件优化了的GPU。因为Larrabee是基于通用环形总线结构的,因此据推测它的总线电力效率也很低,纹理传送工作负载存在总线方面的瓶颈。实际上,适用环形总线的R600也存在着效率问题。
RV770的内部结构(点击放大)
在GPU内部,尽量减轻了内部总线的负载,这其中,图形管线上的渲染输出管道(ROP,Rendering Output Pipeline)通过硬件与存储控制器相连。这是因为ROP所涉及到的深度(Z)与Alpha(α)等数据将会占用带宽,而Larrabee的ROP也是基于CPU内核的软处理模式,为此,为了避免对内部总线的过度负载,基本都在片内的存储器上进行,不过片内的存储器容量被限定为每个核心256KB,以每个核心为单位处理Tiling(俗称:图像瓦片)成为了Larrabee的基本处理模式,而Tiling的划定将取决于绘图算法。
另一方面,对线程以及指令的控制也是有明显不同的,一般而言,现有的GPU已经对传统的API进行了最佳化的控制,而Larrabee则在提供了类似于CPU那样的高自由度的控制特性。譬如,在NVIDIA的Fermi之前的GPU,是将每个GPU的核在同一周期内共同去跑一个内核程序,而在Larrabee中,16核心可以跑不同的程序,这就意味着可以以核为单位进行使命与线程的控制,因此控制机制也相对变得更为复杂。
由此推断,我们可以得出这样的结论——Larrabee为了提高自由度也将牺牲一定的效率。因为它还不可能脱离传统的API而存在,但在对面传统的API时,Larrabee的功耗/能效比将低于现有的GPU。事实上,最初的Larrabee在芯片上几乎没有节省电力的机构,即使是在空闲状态下,功耗也很高,英特尔在CPU方面引以为荣的功耗控制技术并没有得到很好的运用。
Larrabee的结构样本(推测)
Larrabee整体结构(点击放大)
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者