AI促进了“芯经济”的崛起,一个由芯片和软件推动的全球增长新时代。
新闻亮点:
当地时间9月19日,2023英特尔on技术创新大会于美国加利福利亚州圣何塞市开幕。在这一面向开发者举办的大会上,英特尔发布了一系列全新技术,旨在让AI无处不在,并使其在从客户端和边缘,到网络和云的所有工作负载中得到更普遍的应用。
英特尔公司首席执行官帕特·基辛格(Pat Gelsinger)发表了开幕主题演讲,他表示:“AI代表着新时代的到来。AI正在催生全球增长的新时代,在新时代中,算力起着更为重要的作用,让所有人迎来更美好的未来。对开发者而言,这将带来巨大的社会和商业机遇,以创造更多可能,为世界上的重大挑战打造解决方案,并造福地球上每一个人。”
在开幕主题演讲中,基辛格展示了英特尔如何在其各种硬件产品中加入AI能力,并通过开放、多架构的软件解决方案推动AI应用的普及。基辛格还强调了AI对“芯经济”的推动作用,“芯经济”指的是“在芯片和软件的推动下,正在不断增长的经济形态”。如今,芯片形成了规模达5740亿美元的产业,并驱动着全球约8万亿美元的技术经济(tech economy)。
制程、封装和多芯粒解决方案领域的最新进展
“芯经济”的蓬勃发展始于芯片技术的创新。帕特·基辛格表示,英特尔的“四年五个制程节点”计划进展顺利,Intel 7已经实现大规模量产,Intel 4已经生产准备就绪,Intel 3也在按计划推进中,目标是2023年年底。
主题演讲期间,基辛格还展示了基于Intel 20A制程节点打造的英特尔Arrow Lake处理器的首批测试芯片。Arrow Lake将于2024年面向客户端市场推出。Intel 20A将是首个应用PowerVia背面供电技术和新型全环绕栅极晶体管RibbonFET的制程节点。同样将采用这两项技术的Intel 18A制程节点也在按计划推进中,目标是2024年下半年。
除制程外,英特尔向前推进摩尔定律的另一路径是使用新材料和新封装技术,如玻璃基板(glass substrates)。这是英特尔刚于本周宣布的一项突破。玻璃基板将于2020年代后期推出,继续增加单个封装内的晶体管数量,助力满足AI等数据密集型高性能工作负载的需求,并在2030年后继续推进摩尔定律。
玻璃基板测试单元
英特尔还展示了基于通用芯粒高速互连开放规范(UCIe)的测试芯片封装。基辛格表示,摩尔定律的下一波浪潮将由多芯粒封装技术所推动,如果开放标准能够解决IP集成的障碍,它将很快变成现实。发起于去年的UCIe标准将让来自不同厂商的芯粒能够协同工作,从而以新型芯片设计满足不同AI工作负载的扩展需求。目前,UCIe开放标准已经得到了超过120家公司的支持。
该测试芯片集成了基于Intel 3制程节点的英特尔UCIe IP芯粒,和基于TSMC N3E制程节点的Synopsys UCIe IP芯粒。这些芯粒通过EMIB(嵌入式多芯片互连桥接)先进封装技术互连在一起。英特尔代工服务(Intel Foundry Services)、TSMC和Synopsys携手推动UCIe的发展,体现了三者支持基于开放标准的芯粒生态系统的承诺。
以性能提升推动AI无处不在
基辛格强调了目前英特尔平台上可供开发者使用的多种AI技术,以及未来一年将如何大幅拓展相关技术。
近期公布的MLPerf AI推理性能测试结果进一步加强了英特尔的承诺,即覆盖各种规模的AI模型,包括更大、更具挑战性的生成式AI和大语言模型。测试结果亦证明了英特尔® Gaudi®2加速器能够提供满足AI计算需求的绝佳解决方案。基辛格还宣布,一台大型AI超级计算机将完全采用英特尔至强处理器和4000个英特尔Gaudi2加速器打造,Stability AI是其主要客户。
阿里云首席技术官周靖人阐述了阿里巴巴如何将内置AI加速器的第四代英特尔®至强®可扩展处理器用于其生成式AI和大语言模型,即“阿里云通义千问大模型”。周靖人表示,英特尔技术“大幅缩短了模型响应时间,平均加速可达3倍”。1
英特尔还预览了下一代英特尔至强处理器,并透露第五代英特尔®至强®处理器将于12月14日发布,届时,将在相同的功耗下为全球数据中心提高性能和存储速度。此外,具备高能效的能效核(E-core)处理器Sierra Forest将于2024年上半年上市。与第四代至强相比,拥有288核的该处理器预计将使机架密度提升2.5倍,每瓦性能提高2.4倍。紧随Sierra Forest发布的是具备高性能的性能核(P-core)处理器Granite Rapids,与第四代至强相比,其AI性能预计将提高2到3倍2。
第五代英特尔至强处理器
展望2025年,代号为Clearwater Forest的下一代至强能效核处理器将基于Intel 18A制程节点制造。
推出搭载英特尔酷睿Ultra处理器的AI PC
AI也将变得更个人化。基辛格说:“AI将通过云与PC的紧密协作,进而从根本上改变、重塑和重构PC体验,释放人们的生产力和创造力。我们正迈向AI PC的新时代。”
这样全新的PC体验,即将在接下来推出的产品代号为Meteor Lake的英特尔酷睿Ultra处理器上得到展现。该处理器配备英特尔首款集成的神经网络处理器(NPU),用于在PC上带来高能效的AI加速和本地推理体验。基辛格确认,酷睿Ultra也将在12月14日发布。
酷睿Ultra处理器是英特尔客户端处理器路线图的一个转折点:该款处理器是首个采用Foveros封装技术的客户端芯粒设计。除了NPU以及Intel 4制程节点在性能功耗比上的重大进步外,这款处理器还通过集成英特尔锐炫™显卡,带来了独立显卡级别的性能。
英特尔酷睿Ultra处理器
在台上,基辛格展示了全新AI PC的众多使用场景,宏碁首席运营官高树国介绍了搭载酷睿Ultra处理器的宏碁笔记本电脑。高树国表示:“我们与英特尔团队合作,通过OpenVINO工具包共同开发了一套宏碁AI库,以充分利用英特尔酷睿Ultra平台,还共同开发了AI库,最终将这款产品带给用户。”
让开发者成为芯经济的驱动者
帕特·基辛格表示:未来的人工智能必须为整个生态系统可访问性、可扩展性、可见性、透明度和信任度的提升贡献力量。
为助力开发者创造这样的未来,英特尔宣布:
通过一系列全新技术和产品,英特尔揭开了2023英特尔on技术创新大会的帷幕。接下来,英特尔公司首席技术官Greg Lavender将于太平洋时间9月20日上午9:30(北京时间9月21日凌晨0:30)发表主题演讲,介绍英特尔如何以更多方式为开发者在AI领域创造机遇,并加速AI和安全的融合。
1英特尔不控制或审核第三方数据。您可咨询其他来源以评估准确性。
2基于截至2023年8月21日对第四代英特尔至强处理器的架构预测。结果可能不同。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。