带有封装内存的英特尔Lunar Lake实拍照。
今年于中国台湾举办的Computex可谓全球规模最大、影响力最盛的PC贸易展会,英特尔公司CEO Pat Gelsinger在也在会上的主题演讲中披露了关于其Lunar Lake处理器的更多细节。我个人惊讶于英特尔在Gelsinger演讲中居然没有以Lunar Lake和PC为绝对主角——毕竟Computex大会的定位不正是面向PC么。相反,这场演讲更多强调数据中心和服务器AI产品两大主角,我个人认为这并不明智,毕竟多数人都希望在展会上更多关注PC消息。但无论如何,英特尔方面还是传递出了强而有力的信号:芯片巨头打算跟英伟达同台竞争。
就在本届Computex大会之前,我还有幸参加了英特尔在中国台湾组织的技术之旅活动,这也是该公司在全球范围内举办的第三届此类架构简报路演。活动的目标是展示英特尔的最新创新成果,并让大家接触英特尔在全球取得成功的各本地团队。去年的Meteor Lake处理器发布会在马来西亚槟城举行,英特尔在那里进行了大量封装和测试工作。中国台湾对英特尔则更具战略意义,毕竟这里是PC生态系统的核心,各大PC厂商也都在这里设有重要布局。
Lunar Lake是英特尔面对Arm架构日益增长的竞争威胁所拿出的最佳应对方案,本意是要对抗这套来自苹果和高通的架构在笔记本电脑上出色的性能与能效表现。虽然AMD方面也代表一股竞争压力,但其AI处理器的定位更多强调高性能、而非低功耗。Lunar Lake在规格和设计上,也更符合微软提出的Copilot+ PC愿景。
为了实现这些目标,Lunar Lake不仅仅对英特尔的原有设计方案做出了渐进式革新,更是与过去几十年来长期主导PC行业的传统x86范式彻底背离。在平台层面,Lunar Lake属于上一代Meteor Lake架构的进化版,进一步提升了性能与能效,同时延续了其先进的封装设计。而其中最大的特色,就在于引入了封装内存。
英特尔Lunar Lake物理实现示意图。
英特尔完成这项任务的核心因素之一,就是彻底改变了其实现不同类型CPU核心的方式。Lunar Lake代表一个重大突破,其开始专注于能效,并通过在大多数任务中优先使用四个Skymont能效核(简称E核)而非Lion Cove性能核(简称P核)达成了低功耗目标。通过将能效核隔离出来构成四核集群,英特尔得以将尽可能多的工作负载放在更小、更高效的核心之上,并只在必要时才启用更大、更耗电的性能核。
英特尔在Lunar Lake上的工程成就之一,就是在某些工作负载之下,Skymount的单线程性能较上代架构快38%至68%。不仅如此,新的Skymont核心还更具动态特性,能够在三分之一的功率提供相同的性能、以同样的功率提供170%的性能,甚至以更高的功率实现2倍性能。也就是说,Skymont四核集群能够在功率不变的情况下,实现相当于Meteor Lake两个E核2.9倍的处理性能。
这些新型E核的性能如此之高,甚至已经与英特尔第13代和第14代台式机CPU中的早期Raptor Cove性能核基本相当。Lion Cove P核相较于Meteor Lake中的Redwood Cove性能核同样增强14%,使其成为这款CPU中速度最快的核心。英特尔还将这些核心的功率与性能曲线设计为完美重叠,从而最大限度提高了SoC的性能与能效。其中搭载的下一代Thread Director技术则确保将工作负载及时发送至正确的核心、优化效率,并首次优先使用能效E核。
Lunar Lake还是英特尔第二代GPU架构Xe2的首次实现。采用相同架构且备受期待的英特尔Battlemage独立GPU预计也将很快面世。英特尔方面表示,新的Xe2架构比Meteor Lake中的前代架构快50%,并配备有新的XMX引擎,能够将AI处理性能提高至67 TOPS。英特尔还花了一年时间改进其Xe系列GPU的图形驱动程序,这意味着Xe2架构将针对大多数游戏(包括较旧的游戏)进一步做出优化。
再加上同一SoC上NPU提供的48 TOPS预期性能,意味着其可以提供远超100 TOPS的平台AI性能。虽然这是个不错的统计数据,但几乎不可能被同时发挥出来。重要的是,NPU和GPU的性能都相当可观,能够满足开发人员在用户设备上实现高端AI体验的诉求。更重要的是,GPU和NPU可以更高效地提供这种级别的性能,因此极大节约了电池寿命。英特尔表示,其第四代NPU在同等功率下的性能可达上一代的两部,峰值性能则达到上一代的四倍。
英特尔这120平台TOPS的具体算法。
虽然英特尔向来以其出色的CPU产品而闻名,但该公司在连接技术方面同样拥有丰富经验。借助Lunar Lake,英特尔在Wi-Fi和蓝牙方面取得了一系列重大进展,包括集成Wi-Fi 7和蓝牙逻辑,同时分离出一个仅用于RF的模块。Wi-Fi 7解决方案采用独特的低成本单无线电设计,能够实现5.8 Gb吞吐量。而通过集成Wi-Fi和蓝牙逻辑,组合的RF模块与上代解决方案相比,将实现尺寸缩小了28%。英特尔还使用这种Wi-Fi及蓝牙解决方案为其Unison技术提供支持,以实现多设备之间的往来交互。
在有线连接方面,英特尔选择将四个40 Gb/秒Thunderbolt 4连接直接集成至Lunar Lake当中。凭借新推出的Thunderbolt Share等功能,Thunderbolt已经变得愈发强大。它还通过内置的4x PCIe Gen5通道及4x PCIe Gen4通道提供额外的连接选项。这些PCIe通道主要用于存储,同时也可以容纳5G调制解调器或其他需要PCIe连接的设备。
为了保护这些连接,英特尔还采用支持Microsoft Pluton安全技术的全新合作安全引擎。与此同时,英特尔利用NPU增强了对Trend Micro及Crowdstrike等合作伙伴的安全运行效果,两家公司均报告称在Lunar Lake上的性能有所提升。Crowdstrike报告称推理时间缩短了73%,而Bufferzone则表示转向本机运行后使用成本减少了91%。
在英特尔原型PC键盘上拍摄的Lunar Lake芯片。
前文已经提到,Lunar Lake正是英特尔在与苹果和高通激烈竞争的环境之下维持自身领导地位的最佳选项,同时也成为对抗AMD的有力武器。虽然我们暂时无法对Lunar Lake的实际表现下最终断言,毕竟产品要到今年9/10月份才会正式出货,但从英特尔在本届中国台湾技术之旅期间披露的信息可以看出,芯片巨头对这款新品抱有充分的信心——特别是Lunar Lake的SoC功耗成功降低了40%。至少从纸面来看,英特尔的这款产品确实值得一试,但真正的挑战在于如何将Lunar Lake顺利量产。与此同时,英特尔的下一代Arrow Lake酷睿Ultra处理器预计将以截然不同的价值取向和性能配置与广大用户见面。
虽然我个人相信Lunar Lake会成为一款具有市场竞争力的低功耗平台,但其可扩展性的缺失可能会对英特尔在扩展至更高性能平台时构成挑战。尽管下一代Panther Lake应该能够帮助英特尔解决这些现实问题,但相关产品最早也要到2025年才会揭开其神秘的面纱。
目前最大的未知数之一,就是Lunar Lake何时才能获得Windows Copilot+认证。当下就只有高通的骁龙X Plus和骁龙X Elite芯片通过了认证。虽然暂时还无法确定能否成功通过相关认证,但英特尔似乎很有信心在2024年第四季度推出具有 Copilot+功能的Lunar Lake PC。要想实现这个目标,无疑会对Lunar Lake处理器本身的竞争力以及英特尔在PC前沿市场的领先地位维持能力提出重大考验,能否顺利过关恐怕只有等时间来给出答案。
好文章,需要你的鼓励
随着各行各业数字化变革的不断深入,人类社会正加速迈向智能化。作为智能世界和数字经济的坚实底座,数据中心也迎来了蓬勃发展。面
“未来软件定义汽车”的设想也成为马丁当前运营路线的指导方针,且高度关注数据、零件和资产管理等议题。