Pat Gelsinger于2021年初重返英特尔担任CEO。就在这一年,芯片巨头本该推出备受期待的第四代至强SP处理器,代号为“Sapphire Rapids”。但在近两年之后,经历多次延后的这款数据中心芯片才终于在本周二由Gelsinger登台公布。一同推出的,还有代号“Ponte Vecchio”的独立GPU加速器。
在期间的两年中,竞争对手AMD已经凭借最新一代Zen微架构打造的Epyc芯片,从英特尔仍然主导、但份额已不断萎缩的数据中心CPU市场上狠狠挖了几铲。Arm也继续进军数据中心系统,一同冲击这块市场的还包括英伟达与AMD的GPU,各类FPGA、数据处理单元(DPU)等同类芯片,以及用于AI等工作负载的特定加速器/处理器方案。
但如今,第四代至强SP终于问世,Gelsinger终于扬眉吐气。他不光想向全世界宣布这款新处理器的架构改进和众多新功能,更想要借此机会将英特尔从无休止延迟的泥潭重新推回市场有利地位。
他在长达一小时的演讲末尾表示,“Sapphire Rapids只是这段旅程的下个阶段。至强路线图取得了长足进步,也迎来了关键里程碑,重建了我们客户对于英特尔实施基础技术的信心。我们在自身技术、工艺以及四年内五大发展节点的大胆愿景上终于践行承诺,一切都将回归正轨。因为自成立以来,英特尔就从内心深处坚守着对于半导体创新目标的追求。正如摩尔定律所描述的那样,我们将持续创新,直到摩尔定律真正走到尽头、元素周期表里的一切元素均被用尽。我们始终坚信技术的力量,我们提供的骨干网技术更新和至强底层支持都在整个人类社会中扮演着创新基础的角色。作为一家企业,英特尔积极参与其中,希望在我们的技术之上塑造新的世界。”
不可否认,英特尔在数据中心芯片领域仍是头面人物。但是,整个行业正变得愈发多样化,AMD和Arm都在开拓属于自己的市场空间。
在此次活动中,Gelsinger和其他英特尔高管也重申了其对于数据中心的深入影响。这种影响不仅体现在企业设施、高性能计算(HPC)和云领域,也体现在最终成功将Sapphire Rapids推向市场背后对应的创新实力。Gelsinger对于第四代至强SP不吝赞美之词,介绍了其普版系列、集成有高带宽内存(HBM)以供HPC类工作负载的Max系列,外加被划入GPU Max系列的Ponte Vecchio。一同登台的还有英特尔数据中心与AI部门执行副总裁兼总经理Sandra Rivera和至强产品部门副总裁兼总经理Lisa Spelman。
Rivera指出,如今全球计算系统中安装的至强芯片已突破1亿块,应用场景涵盖服务器、网络系统以及各类“即服务”基础设施。众多来自硬件、软件和云生态系统合作伙伴和客户的知名高管,也以线上方式参与到讨论当中。他们盛赞新芯片的功能,为Gelsinger做出的英特尔行业地位论断背书。此次亮相的包括Michael Dell、英伟达CEO黄仁勋、HPE总裁兼CEO Antonio Neri,以及来自微软、思科、浪潮、超微、联想和甲骨文等公司的其他高管。
此外,包括HPE、思科和联想在内的众多公司也在周二推出了由新芯片支持的系统。预计很快就会有更多公司跟进,推出同样基于Sapphire Rapids的新产品。
Rivera和Spelman还在活动现场和网上向观众们介绍了新处理器的主要亮点。Rivera表示,Sapphire Rapids架构在设计上充分考虑到大量数据的创建、收集、控制与分析等需求,全面支持相应的快速负载变化。如今,全球连接性持续增强、现代工作负载日益复杂,AI、机器学习和分析等已经成为主流。系统不仅需要性能更强的组件,更需要提供更出色的安全性和能效。
Rivera强调,“要为工作负载提供专用加速,依靠的绝不仅仅是添加更多核心。这需要一种真正的系统级方法,通过高度优化的软件针对硬件差异和特性做出调整,这样才能加速AI、网络、HPC和安全等各种关键业务工作负载。这也代表着处理器范式层面的重大转变,即顺应业务部门运行工作负载的方式、顺应他们解决计算问题的需求。”
她和Spelman也谈到了芯片内置加速器,包括用于AI性能提升的英特尔高级矩阵扩展(AMX),用于分担加密、解密和压缩的QuickAssist技术(QAT),内存分析加速器(IAA),加密加速器,以及用于在虚拟机层次上提升机密性的信任域扩展(TDX)等。
两位还简要介绍了各类加速器及其对应功能的各种改进,包括每瓦性能效率提高2.9倍,总体拥有成本降低52%至66%,通用计算的总体平均性能提高53%,数据分析性能提高3倍,内存受限的HPC工作负载性能更是改善达3.7倍。
spelman指出,其中大部分提升来自Max系列CPU中集成的HBM技术,其解决了HPC应用场景下的一项重大挑战。
“多年以来,计算容量的增长速度远快于内存带宽,因此导致工作负载的性能始终难以均衡发展。换言之,多出来的计算容量实际是搁浅了,因为我们无法向核心提供足够的数据。这种进步的障碍会白白浪费掉计算周期、能源和成本。”
Max系列是唯一集成HBM的x86架构芯片,不仅能将性能提升3.7倍,而且比市面上其他同类系统的功耗低68%。Spelman还提到,开发人员无需变更代码即可享受新芯片提供的高带宽。
洛斯阿拉莫斯国家实验室HPC平台与项目主管Jim Lujan在为英特尔录制采访视频时,也提到了集成HBM。Lujan表示,该实验室拥有一系列建模与仿真项目,包括美国核储备监控、流行病学研究、先是防御和气候建模等关键事务。
“我们已经对部分关键应用进行了分析。这些应用程序虽然执行大量计算,但限制性能的却主要在内存、而非算力。因此在为Corssroads超级计算机项目组织采购时,我们开始寻求提高洞察力的方法,希望减少内存带宽引发的性能瓶颈。”
在Lujan看来,带有HBM的Max系列芯片正是理想的解决方案。他还提到,该实验室的开发人员能够轻松将现有代码从原有至强系统转移至Sapphire Rapids系统。种种现实案例的加持,也让Gelsinger在台上讲话时显露出一种充满希望和底气的状态。
“过去几年,事实已经证明技术越来越成为人类生活中各个层面的核心要素,而芯片正是技术的核心驱动力。一切都在朝着数字化方向前进,这是技术的奇迹。作为一家企业,我们英特尔致力于持续推动、发现和开发创新成果。一亿块至强处理器,这是何等庞大的安装基础、何等非凡的技术平台!与客户和合作伙伴携手努力,我们也将在这个非凡的基础之上借第四代至强芯片保持这股势头。”
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
研究表明,现有的公开 AI 模型在描述大屠杀历史时过于简单化,无法呈现其复杂性和细微之处。研究人员呼吁各相关机构数字化资料和专业知识,以改善 AI 对这段历史的理解和表述。他们强调需要在 AI 系统中加入更多高质量的数据,同时在审查和信息获取之间寻求平衡。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。