英特尔近日在第二届年度Intel Innovation活动中表示,将把一些最为先进的技术引入英特尔Intel Developer Cloud平台上。
与此同时,英特尔公布了GPU产品组合的多项升级。
开发者云
英特尔首席执行官Pat Gelsinger在Intel Innovation 2022活动的主题演讲中宣布了对Intel Developer Cloud的更新。此次活动上,英特尔重磅推出了下一代桌面CPU——即第13代英特尔酷睿系列产品,该产品相比上一代芯片单线程性能提高15%,多线程性能提高41%。
Gelsinger在他的主题演讲中谈到了如今开发者在厂商锁定、获取最新硬件更新、安全性方面面临的诸多挑战。
他说,为了帮助开发者应对这些挑战,英特尔将在Intel Developer Cloud中解锁新的技术,从而让开发者能够使用到一些最新的硬件,目前这些新技术已经可以通过有限的beta试用获得。
部分客户现在可以对新平台进行测试,包括基于Sapphire Rapids新架构的第四代英特尔至强可扩展处理器、具有高带宽内存的第四代英特尔至强处理器、以及基于Ice Lake D的英特尔至强D处理器。Gelsinger说,同时面市的还有英特尔即将推出的Habana Gaudi 2深度学习加速器,以及代号为Ponte Vecchio的Intel Data Center GPU。
他说,开发者可能还想试用英特尔新的Intel Geti计算机视觉平台,任何正在寻找一种快速简便的方法来开发有效AI模型的人都可以使用该平台。Intel Geti平台提供了一个上传数据、注释、模型训练和再训练的统一界面,从而缩短了创建新AI模型所需的时间、成本和专业知识。
Gelsinger说:“在未来的十年里,我们将看到一切都在持续数字化。五大基础技术力量——计算、连接、基础设施、人工智能和传感——都将深刻地塑造我们体验这个世界的方式。”
他说,这个未来将由专注于硬件和软件的开发者所打造。“他们是推动实现一切可能性的、真正的魔术师。培育开放的开发者生态系统是我们转型的核心,开发者社区对我们取得成功是至关重要的。”
英特尔在GPU领域也取得了不错的进展。Gelsinger表示,英特尔下一代Intel Data Center GPU现在已经交付给第一个客户美国阿贡国家实验室,并将在那里为Aurora超级计算机提供动力。
同时,英特尔还更新了Flex系列GPU,为视觉云工作负载提供了一套单一的GPU解决方案,现在支持主流的AI框架例如OpenVINO、TensorFlow和PyTorch。
此外,英特尔推出了基于软件的Xe Super Sampling游戏性能加速器,支持20多款顶级游戏。最后,Gelsinger宣布推出新的加速器用于第四代英特尔至强可扩展处理器,适用于包括人工智能、数据分析、网络和存储在内的特定工作负载。
扩展生态系统
英特尔面临着其他芯片制造商的激烈的竞争,但也认识到在这个行业有时候也可以从合作中受益。Gelsinger在活动中邀请了来自三星和台积电的代表,上台讨论Universal Chiplet Interconnect Express(UCIe)联盟的相关工作,三家厂商都是该联盟的成员。UCIe联盟正在构建一个开放的生态系统,以确保由竞争厂商基于不同工艺技术设计和构建的小芯片,可以通过集成先进封装技术展开协同。
Gelsinger坚持认为,随着全球三大芯片制造商以及80多家半导体领域相关公司的加入,UCIe联盟正在快速变成现实。他承诺,英特尔及旗下芯片制造部门Intel Foundry Services将引领开创一个所谓“系统代工”的新时代,他说,这个时代包含了四个主要部分:晶圆制造、封装、软件、开放的小芯片生态系统。
“那些曾经被认为不可能实现的创新,为芯片制造开辟了全新的可能性,”Gelsinger说。
他介绍了该联盟的首批创新:具有突破性的、可插拔的共封装光子学解决方案。光子学等光学连接技术有望大幅增加芯片到芯片的带宽,这在数据中心可能是特别有价值的。但直到现在,这项技术还没有实现这些承诺,因为制造上的难度意味着这种技术的成本是非常高的。
不过Gelsinger表示,英特尔现在已经通过开发一种坚固的、高产的、基于玻璃的可插拔连接器解决方案克服了这一问题,这有望减少制造难题并降低成本,为具有互操作性的系统和芯片封装架构带来新的可能性。
最后,英特尔公布了有关于提供资金支持打造未来生态系统的最新情况。今年早些时候,英特尔成立了10亿美金的IFS Innovation Fund基金,旨在支持那些正在开发颠覆性代工生态系统技术的早期初创公司和一些更成熟的公司,此后英特尔投资了三家在半导体堆栈方面进行创新的初创公司,包括Astera Labs、SiFive和Movellus。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。