至顶网›服务器频道 ›服务器组件›Intel修改Larrabee各代间隔究竟为哪般？

Intel修改Larrabee各代间隔究竟为哪般？

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

Intel取消了将Larrabee作为一款图形产品投产的计划。原因是什么？

来源：ZDNet编译 2010年1月4日

关键字： GPU Larrabee Intel

在本页阅读全文(共4页)

● Larrabee究竟面临什么问题？

Intel从很早就开始向一部分用户发售Larrabee的样品，让用户对其进行评估，然后获得反馈。所以，有人推测Intel修正Larrabee战略时间间隔的一个很大原因可能就是Intel得到了关于Larrabee作为图形芯片的糟糕反馈结果。

实际上，有消息称对Larrabee图形系统的评估并不理想。尤其是现有图形任务的性能效率非常糟糕。虽然我们并没有得到关于性能评价的细节，但是好像缺失存在效率方面的问题。

尤其是于GPU对比的话，每瓦能耗的性能相当地，因此据称它还不具备GPU的竞争力。有传闻称它的“性能/电力太低”。

从架构方面很容易想到会有这样的评价。

在这几个图形处理功能中，Larrabee唯一没有采用软件处理的功能是“纹理过滤”，因此，它在效率方面很难胜过那些对现有图形API进行硬件优化了的GPU。因为Larrabee是基于通用环形总线结构的，因此据推测它的总线电力效率也很低，纹理传送工作负载存在总线方面的瓶颈。实际上，适用环形总线的R600也存在着效率问题。

RV770的内部结构（点击放大）

在GPU内部，尽量减轻了内部总线的负载，这其中，图形管线上的渲染输出管道（ROP，Rendering Output Pipeline）通过硬件与存储控制器相连。这是因为ROP所涉及到的深度（Z）与Alpha（α）等数据将会占用带宽，而Larrabee的ROP也是基于CPU内核的软处理模式，为此，为了避免对内部总线的过度负载，基本都在片内的存储器上进行，不过片内的存储器容量被限定为每个核心256KB，以每个核心为单位处理Tiling（俗称：图像瓦片）成为了Larrabee的基本处理模式，而Tiling的划定将取决于绘图算法。

另一方面，对线程以及指令的控制也是有明显不同的，一般而言，现有的GPU已经对传统的API进行了最佳化的控制，而Larrabee则在提供了类似于CPU那样的高自由度的控制特性。譬如，在NVIDIA的Fermi之前的GPU，是将每个GPU的核在同一周期内共同去跑一个内核程序，而在Larrabee中，16核心可以跑不同的程序，这就意味着可以以核为单位进行使命与线程的控制，因此控制机制也相对变得更为复杂。

由此推断，我们可以得出这样的结论——Larrabee为了提高自由度也将牺牲一定的效率。因为它还不可能脱离传统的API而存在，但在对面传统的API时，Larrabee的功耗/能效比将低于现有的GPU。事实上，最初的Larrabee在芯片上几乎没有节省电力的机构，即使是在空闲状态下，功耗也很高，英特尔在CPU方面引以为荣的功耗控制技术并没有得到很好的运用。

Larrabee的结构样本（推测）

Larrabee整体结构（点击放大）

VIP专区

VIP用户

普通用户

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题

往期文章

Intel修改Larrabee各代间隔究竟为哪般？

业界热点: