加速内存带宽创新:英特尔至强CPU Max系列,率先集成高带宽内存的x86处理器
治疗癌症、减缓全球变暖、保护生态健康——当今世界充满了各种挑战。因此,通过科技紧跟时代发展步伐,并充分利用不断增长的数据至关重要。这不仅涉及数据的处理速度,也涉及能够处理的海量数据,以及数据在内存和处理器之间的传输速度。
英特尔设计工程部首席工程师、英特尔®至强® CPU Max系列(代号Sapphire Rapids HBM)首席架构师Ugonna Echeruo如此描述这一挑战:究其根本,一颗CPU是从内存获取信息、对其进行处理并更新。CPU最终可以处理的信息量受限于数据传输“管道”的宽窄。管道越宽,CPU处理的信息就越多,相应地,完成的任务也就越多。
Echeruo补充说道,英特尔聚焦开发了一种新型解决方案来应对受内存带宽限制的工作负载。目前,解决数据受限的方案是利用高带宽内存(HBM),同时他也表示解决方案未来可能会发生变化。该解决方案让CPU能够获取更多数据,让即使有着庞大计算需求的客户也能获得满足。尽管第四代英特尔®至强®可扩展处理器本身就可以处理繁重的工作负载,Echeruo指出,其实高带宽内存特别适用于性能受制于内存带宽,亦或是同时受制于内存带宽和计算限制的工作负载。
Echeruo将Max系列CPU的发布视为他在英特尔20多年职业生涯中的“高光时刻”。对此有充分理由——英特尔至强CPU Max系列处理器是英特尔首款也是唯一一款集成高带宽内存的x86处理器。
满足客户需求
Echeruo说,研究实验室和大学等客户是Max系列CPU问世的主要原因。
“客户的应用程序需要大量内存带宽,而在使用现有产品时受到带宽的限制。”他说,这些客户一直希望英特尔可以提高带宽来满足他们的需求。
比如一个用海量数据进行科学计算的实验室。在没有高带宽内存的传统系统中,每个研究人员都需要利用许多计算节点来生成解决方案。得益于高带宽内存,Max系列CPU提高了性能和内存带宽,无需更改代码,最终能帮助研究人员使用更少的资源完成相同的任务,从而提高实验室的整体生产力和能效。
高带宽内存基础知识
我们把CPU想象成汽车里的内燃机。汽车的性能受到了限制,是因为只有一定量的空气可以被泵入燃烧室与汽油混合。涡轮增压和机械增压的出现解决了汽车性能受限的问题。对于CPU,就是高带宽内存。现在我们可以让更多空气进入,达到比以往任何时候都更快的速度!
随着时间的推移,CPU“管道”(如Echeruo开头的描述)将更多空气输送到“燃烧室”。管道更宽,内存和CPU之间接口的吞吐量就会增加。有了更宽的管道,能力更强的CPU就可以处理更多数据,相应地也更能够满足客户的需求。高带宽内存就像涡轮增压器,把CPU的能力提升到更高水平。
应对挑战
Echeruo解释说,高带宽内存在CPU上的位置或接近程度是其成功的关键。高带宽内存焊接在电路板上,靠近处理器,可以快速、方便地获取必要的信息。另外一个好处是,离得越近就越省电。
但毫无疑问,他说,这并不像把高带宽内存粘在CPU封装上那么简单。
Echeruo说:“所有参与的团队都面临很多挑战。”他解释到,设计确定后,团队就开始打磨第四代英特尔至强处理器,因此需要进行大量测试和验证,以确保高带宽内存方案取得成功。Echeruo还表示,“我们想把这种增强型内存系统连接到英特尔最好的计算内核——至强内核,并将两者结合起来。”
他补充道,“我们必须仔细研究产品中的每个IP,确保它们不会与高带宽内存产生任何冲突。我们需要确保能够充分利用尽可能多的带宽,必须弄清楚如何做出必要的更改,使高带宽内存成功地发挥作用,同时不影响标准产品的时间安排和交付。”
发挥优势
Echeruo说能效是Max系列CPU的另一大优势。高带宽内存接近CPU不仅省电,而且在有高带宽内存的情况下,用户通常需要更少的系统和容量,这也会节约成本。在一些应用场景下,用户可以舍弃外部的DDR5内存,从而直接使用高带宽内存。
英特尔率先在x86处理器中集成高带宽内存,Echeruo认为这是“英特尔的重要优势”。展望未来,Echeruo认为其关键是“利用英特尔的软件堆栈,使高带宽内存更易于且便于客户使用。”
谈到用户友好性,不同于集成高带宽内存的GPU,Max系列CPU不需要花费大量人力更改代码,省时省力。Echeruo说:“越便于客户使用,他们就会越满意。这对英特尔来说也是喜闻乐见的。”
创新不止于此。在几周前的2023年国际超算大会(ISC)上,英特尔展示了即将推出的高内存带宽产品,即代号为Granite Rapids的下一代英特尔至强处理器,其支持Multiplexer Combined Ranks (MCR)内存。
科技驱动,创造美好世界
至强Max将帮助拓展人们对于基础科学的认知。Echeruo说,这在一定程度上也推动着他不断前行。
Echeruo表示:“这些产品将用于服务器中,推动企业现在及未来在基础科学、医学或云基础设施等方面的探索。”
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。