英特尔今天推出了第四代英特尔至强Intel Xeon可扩展处理器、英特尔至强Intel Xeon CPU Max Series系列和英特尔Data Center GPU Max Series系列,有望在数据中心性能和效率方面实现飞跃。
这些处理器为人工智能、云、网络和边缘、以及全球最强大的超级计算机提供了更高的安全性和增强的新功能。英特尔通过与合作伙伴合作设计全新的第四代至强处理器,以大规模提供差异化解决方案和系统来应对他们最大的计算挑战。
英特尔表示,此次发布的新处理器提供了工作负载优先加速,以及针对特定工作负载调整的高度优化软件,使用户能够以合适的功率提供合适的性能,从而实现最佳的总体拥有成本。此外,这些处理器为客户提供了一系列管理电源和性能的功能,优化了CPU资源的使用,以帮助实现他们的可持续发展目标。
英特尔执行副总裁、数据中心和人工智能集团总经理Sandra Rivera在一份声明中表示:“第四代至强可扩展处理器和Max系列产品系列的推出,是推动英特尔转型的关键时刻,重新铺就了我们通往数据中心领导地位的道路,并扩大了我们在新领域的足迹。英特尔第四代至强和Max系列产品提供了客户真正想要的东西,也就是在安全环境中满足实际需求的领先性能和可靠性,从而加快实现价值的时间并推动他们的创新步伐。”
此次推出的第四代至强系列通过提供领先的性能和可持续性,扩展了英特尔专门构建的、工作负载优先的战略和方法,主要特点包括这些处理器提供了目前现有CPU中最多的内置加速器,以应对客户在人工智能、分析、网络、安全、存储和高性能计算方面最重要的计算挑战。
与前几代英特尔至强处理器相比,第四代处理器在使用内置加速器时帮助目标工作负载实现了平均每瓦性能效率2.9倍的提升。在优化电源模式下,客户还可以实现每个CPU高达70瓦的功率节省,同时将性能损失降至最低。
随着可持续性对数据中心变得越来越重要,第四代至强系列提供了额外的节能效果。新的优化电源模式可为特定的工作负载节省20%的插槽空间,而性能影响小于5%。新的空气和液体冷却创新也降低了数据中心的总能耗。
在人工智能方面,第四代至强系列处理器通过内置的英特尔高级矩阵扩展加速器实现更高的PyTorch实时推理和训练性能,据称这些流程可以在广泛的人工智能工作负载中为推理和训练解锁新的性能水平。
性能表现
据英特尔称,第四代至强和Intel Max系列产品提供了可扩展的平衡架构,将CPU和GPU与oneAPI开放软件生态系统集成在一起,用于高性能计算和人工智能中要求苛刻的计算工作负载。
英特尔表示,Xeon CPU Max系列是第一款也是唯一一款具有高带宽内存的、基于x86的处理器,无需更改代码即可加速许多高性能计算工作负载。英特尔Data Center GPU Max系列是英特尔密度最高的处理器,将提供多种外形规格以满足不同客户的需求。
Xeon CPU Max系列提供了64 GB的高带宽内存(HBM2e),显着提高了高性能计算和人工智能工作负载的数据吞吐量。与第三代英特尔至强可扩展处理器系列的高端性能相比, Xeon CPU Max系列在能源和地球系统建模等一系列现实世界应用中可实现3.7倍的性能水平提升。
Data Center GPU Max系列将超过1000亿个晶体管集成到一个47个小芯片封装中,为具有挑战性的工作负载(如物理、金融服务和生命科学)将吞吐量提升到新的水平。当与Xeon CPU Max系列搭配使用的时候,这一组合平台在运行大型原子/分子大规模并行模拟器时的性能要比上一代高出12.8倍。
安全性
此次推出的芯处理器系列,其基础是安全性。英特尔称,第四代至强系列提供了业内所有数据中心芯片厂商中最全面的机密计算产品组合,增强了数据安全性、法规遵从性和数据主权。
除了现有的Intel Software Guard Extensions 之外,该系列还提供了新的虚拟机隔离技术Intel Trust Domain Extensions,让用户可以把现有应用移植到机密环境中,并在微软Azure、阿里云、谷歌云和IBM云上支持该技术。
好文章,需要你的鼓励
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传统查询相关的压缩方法,KVzip创建可在多种查询场景下重用的通用压缩缓存,特别适合个性化AI助手和企业信息检索系统。研究在LLaMA3.1-8B、Qwen2.5-14B和Gemma3-12B等多种模型上进行了验证,处理长度高达17万词元的文本,并能与KV缓存量化等其他优化技术无缝集成。
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析了12种偏好机制,发现人类评判者重视权威性和清晰度,而AI评判更关注事实准确性。他们提出的层次多领域回归模型不仅能准确预测偏好,还能清晰解释判断过程,为构建更透明、更符合人类价值观的AI系统提供了新途径。