扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:John McCalpin、Chuck Moore、Phil Hester 来源:AMD 2007年7月3日
关键字:
在本页阅读全文(共5页)
2. 多核心芯片最初的开发
多核心处理器最初的开发在很大程度上要归功于 CMOS 光刻印刷工艺的持续进步。众所周知,随着CPU 核心的尺寸/带宽的不断提升,很快就会造成投资回报的递减。所以当核心的尺寸工艺收缩到一个小尺度上后,出于对Die经济可行性的考虑,制造商通常有如下选择:
增加更多内存带宽的选择显然会增加大量处理器芯片之外的成本,包括修改主板(如许多PCB层的改动)、增加DIMM插槽等。由于这些额外成本和插槽不兼容的问题,增加更多内存带宽将被单独考虑,与涉及Die尺寸的选项不相关。
图 1 和图 2 显示了一些与这三个选项相关的性能和性能价格比指标,假定光刻印刷面积缩减30%(即区域缩减50%),支持单核心频率提高17%,但需要双核心频率降低17%(以保持相同的功耗水平)。
注意,SPECfp_rate2000基准测试包含14个独立的测试,它们均单独建模。这些可以总结为:最小提速、中值提速、几何平均数提速和最大提速。对于双核心处理器选项,要同时估算单核心 (uni) 和双核心 (mp) 提速。
图 1:针对三种系统配置进行SPECfp_rate2000 性能评估(基于章节 1 中描述的分析模型),假定光刻面积缩减30%(区域缩减50%),相应地,单核心芯片频率提高 17%,双核心芯片频率降低 17%。小型芯片的尺寸为参考芯片的½,同时,大缓存和双核版本扩展到与参考芯片相同的尺寸,且电源需求与参考芯片相同。注意,大缓存情况下的最大提速为+156%,但由于此处的图形范围限制而被截断显示。
图 2:针对三种系统配置的SPECfp_rate2000/价格评估(基于章节 1 中描述的分析模型),假定光刻面积缩减30%(区域缩减50%),相应地,单核心芯片频率提高 17%,双核心芯片频率降低 17%。
依次观察这三种选择:
2.1. 生产更小的芯片
显然,量产那些时钟频率仅满足基本需求的更小/更便宜的芯片,在为客户提升性能和性能价格比方面价值不大。在此例中,处理器价格的下降可以将系统整体成本降低 14%(1,800 美元比 2,100 美元),而 17% 的频率提高可以在性能方面带来 0% 到 14% 的提升,中间和几何平均数提升为 8%-9%(图 1)。这两种因素的结合可以提供 17% 到 33% 的性能价格比提升,其中间和几何平均数性能价格比提升为 27%-28%。
2.2. 增加大量片上缓存
与其他选择相比,增加大量缓存为所有工作负载带来的提升变化范围更大。在此例中,将 L2 缓存从 1 MB 提高到 3 MB 可以带来 0% 到 127% 的性能提升,其中值提升为 0%,几何平均数提升为 11.8%。
17%的CPU频率提升与缓存规模提升相结合可以带来更多收益,二者结合的性能提升为0%到156%,中值提升为11.5%,几何平均数提升为22.5%。
在此情况下,假定芯片的成本与参考系统相同,则性能价格比的提升比率与纯性能提升比率相同。
2.3. 增加CPU 核心
增加核心可以广泛提升各种工作负载的吞吐量,并需要付出不大的频率降低(17%)以满足功耗/冷却限制。在此,我们假设50%的区域缩减使我们能够容纳2个CPU核心,每个都配备与参考芯片相同的L2缓存且成本相同。在运行单一进程时,性能比参考平台低 0% 到 15%,中间和几何平均数性能变化为 -10% 到 -11%。
如果我们可以使用第二个核心运行第二个代码副本,则系统的吞吐量可以提高 0% 到 最大的54%,中间和几何平均数提速为 29% 到 32%。
在这种情况下,假定芯片的成本与参考系统相同,则性能价格比的提升比率与纯性能提升比率相同。
2.4. 讨论
上面三个实例提供了大量令人困扰的独立性能和性价比指标——70 个相对值。就算将SPEC基准测试的14 个性能值减少到3个(最小、几何平均数、最大),仍然给我们留下了9个性能值和12 个性价比值(其中9个与性能值相同)。将这些值结合为1个指标,用以制定合理的设计决策并不是一项轻而易举的事。
这三个选项都具有明显的优势和不足:
设计选项 |
主要优势 |
主要缺点 |
小芯片 |
降低价格 |
最弱的提升幅度 |
大缓存 |
在少数代码上有巨大的性能提高 |
最弱的中间和几何平均数性价比提升 |
双核心 |
最强的中间和几何平均数吞吐量提升 |
降低了单处理器性能 |
找到这六项主要优势或主要缺点中的哪些会对哪些客户构成关键决策因素,相对简单。而上述信息的利用、推广,以及用其来支持公司的商业模型就要复杂得多。
当然,设计决策必须支持公司投资的商业模式。即使是看起来最简单的目标“赚钱”在细节检查上也会一片混乱。可以将商业模型设计为取得最佳短期收入、短期利润、长期收入、长期利润、市场“轰动”或“良好愿望”,也可以设计为实现具体市场份额目标或尽量向竞争对手施加财务压力。真实的市场模型是这些目标的复杂结合,不幸的是,对于“纯粹”的设计优化流程,不同的商业目标可以改变各种性能和性能价格比指标的相对重要程度。
2.5. 补充说明
在所有这些情况中,性能的变化取决于基准系统上内存性能与 CPU 性能的比率。随着可用带宽的提高,大缓存的优势将递减,而更多 CPU 核心的优势将提高。与此相反,相对较低的内存带宽会使大缓存更为关键,而明显降低增加CPU核心带来的吞吐量提升。
对于对缓存有利的SPECint_rate2000基准测试,以2.2 GHz运行的IBM e326服务器上的结果显示:在SPECint_rate2000上,每芯片上同频率核心数量的翻倍可以将吞吐量提高65%到100%(几何平均数提升 = 95%)。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者