扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共5页)
接下来,Philippe Thierry的重点放在了HPC系统的性能优化上。他表示,其实性能优化的原理是很简单的,但越是简单的原理,实践起来往往也是最为复杂的。但这种事急不得,只能按部就班的一步步进行。
在Philippe Thierry看来,性能优化的目标就是保持CPU以最有效率的模式忙于工作,这里有两个重点——“最有效率”和“忙”,前者主要是与编程相关,需要尽可能的根据应用的特性进行优化,并尽量采用CPU加速指令集,而后者则在于让整体的硬件系统都能跟得上CPU的步伐,而不是让CPU经常处于等待I/O数据交换的状态——忙不起来
Philippe Thierry非常强调内存的重要性,因为它是CPU与外界沟通的第一道门槛,在某种意义上讲,内存是CPU与I/O设备沟通的一个巨大的缓冲区,是最为繁忙的数据跳转站,而如果想要充分发挥CPU的浮点运算性能,充足的内存带宽是必不可少的
Philippe Thierry以至强5500系统举例,双CPU的总内存带宽最高约为64GB/s(以DDR3-1333计算,传输率为1333MHz,每个传输周期8个字节,第颗CPU有三个内存通道,所以就是1333MHz [传输率]x 8[每周期传输字节数] x 3[每颗CPU的内存通道数量] x 2[两颗CPU]),而实际的STREAM内存带宽将近为42GB/s,这相对于以往传统的SMP架构已经有了很大的提升,但对于发挥现有处理器的浮点运算能力还是有差距的。为此,Philippe Thierry表示,英特尔将不断致力于内存系统性能的提升。
在另一方面,专用的加速指令集也在发挥着越来越重要的作用,而用好这些指令集,往往也会起到事半功倍的效果
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者