英特尔今天推出了第四代英特尔至强Intel Xeon可扩展处理器、英特尔至强Intel Xeon CPU Max Series系列和英特尔Data Center GPU Max Series系列,有望在数据中心性能和效率方面实现飞跃。

这些处理器为人工智能、云、网络和边缘、以及全球最强大的超级计算机提供了更高的安全性和增强的新功能。英特尔通过与合作伙伴合作设计全新的第四代至强处理器,以大规模提供差异化解决方案和系统来应对他们最大的计算挑战。
英特尔表示,此次发布的新处理器提供了工作负载优先加速,以及针对特定工作负载调整的高度优化软件,使用户能够以合适的功率提供合适的性能,从而实现最佳的总体拥有成本。此外,这些处理器为客户提供了一系列管理电源和性能的功能,优化了CPU资源的使用,以帮助实现他们的可持续发展目标。
英特尔执行副总裁、数据中心和人工智能集团总经理Sandra Rivera在一份声明中表示:“第四代至强可扩展处理器和Max系列产品系列的推出,是推动英特尔转型的关键时刻,重新铺就了我们通往数据中心领导地位的道路,并扩大了我们在新领域的足迹。英特尔第四代至强和Max系列产品提供了客户真正想要的东西,也就是在安全环境中满足实际需求的领先性能和可靠性,从而加快实现价值的时间并推动他们的创新步伐。”
此次推出的第四代至强系列通过提供领先的性能和可持续性,扩展了英特尔专门构建的、工作负载优先的战略和方法,主要特点包括这些处理器提供了目前现有CPU中最多的内置加速器,以应对客户在人工智能、分析、网络、安全、存储和高性能计算方面最重要的计算挑战。
与前几代英特尔至强处理器相比,第四代处理器在使用内置加速器时帮助目标工作负载实现了平均每瓦性能效率2.9倍的提升。在优化电源模式下,客户还可以实现每个CPU高达70瓦的功率节省,同时将性能损失降至最低。
随着可持续性对数据中心变得越来越重要,第四代至强系列提供了额外的节能效果。新的优化电源模式可为特定的工作负载节省20%的插槽空间,而性能影响小于5%。新的空气和液体冷却创新也降低了数据中心的总能耗。
在人工智能方面,第四代至强系列处理器通过内置的英特尔高级矩阵扩展加速器实现更高的PyTorch实时推理和训练性能,据称这些流程可以在广泛的人工智能工作负载中为推理和训练解锁新的性能水平。
性能表现
据英特尔称,第四代至强和Intel Max系列产品提供了可扩展的平衡架构,将CPU和GPU与oneAPI开放软件生态系统集成在一起,用于高性能计算和人工智能中要求苛刻的计算工作负载。
英特尔表示,Xeon CPU Max系列是第一款也是唯一一款具有高带宽内存的、基于x86的处理器,无需更改代码即可加速许多高性能计算工作负载。英特尔Data Center GPU Max系列是英特尔密度最高的处理器,将提供多种外形规格以满足不同客户的需求。
Xeon CPU Max系列提供了64 GB的高带宽内存(HBM2e),显着提高了高性能计算和人工智能工作负载的数据吞吐量。与第三代英特尔至强可扩展处理器系列的高端性能相比, Xeon CPU Max系列在能源和地球系统建模等一系列现实世界应用中可实现3.7倍的性能水平提升。
Data Center GPU Max系列将超过1000亿个晶体管集成到一个47个小芯片封装中,为具有挑战性的工作负载(如物理、金融服务和生命科学)将吞吐量提升到新的水平。当与Xeon CPU Max系列搭配使用的时候,这一组合平台在运行大型原子/分子大规模并行模拟器时的性能要比上一代高出12.8倍。
安全性
此次推出的芯处理器系列,其基础是安全性。英特尔称,第四代至强系列提供了业内所有数据中心芯片厂商中最全面的机密计算产品组合,增强了数据安全性、法规遵从性和数据主权。
除了现有的Intel Software Guard Extensions 之外,该系列还提供了新的虚拟机隔离技术Intel Trust Domain Extensions,让用户可以把现有应用移植到机密环境中,并在微软Azure、阿里云、谷歌云和IBM云上支持该技术。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。