Flex 系列 GPU 可提供更出色的媒体转码吞吐性能和支持多达 68 路实时云游戏流,旨在满足智能视觉云的工作负载需求。
全新产品:英特尔®数据中心 GPU Flex 系列(曾用代号 Arctic Sound-M )能够帮助客户突破孤立且封闭的开发环境的限制,同时降低数据中心对于不得不使用多个分离、独立的解决方案的需求。英特尔为客户提供的单一 GPU 解决方案,能够在不牺牲性能或质量的情况下,灵活处理多种工作负载。这一优势可让它在支持多种云工作负载如媒体传输、云游戏、人工智能、元宇宙等新兴视觉云使用场景的同时,降低或优化相关的总体拥有成本。

英特尔副总裁兼超级计算事业部总经理 Jeff McVeigh 表示:“我们正处于一场由更多用户、更多应用和更高分辨率所共同驱动的‘像素爆炸’变革中。当今的数据中心基础设施承担着计算、编码、解码、传输、存储和显示视觉信息的巨大压力。英特尔 Flex 系列 GPU 采用突破性的设计,更有针对性地满足了现阶段的相关计算需求,同时也为未来的沉浸式体验提供了灵活性和可扩展性。”
强大性能:Flex 系列 GPU 可满足图像质量、部署密度和时延方面的要求。在集成了基于硬件的、业界领先的 AV1 编码器的基础上,Flex 系列数据中心 GPU 可以提供更出色的媒体转码吞吐性能和解码吞吐性能,且能耗低于同类型解决方案。它还实现了 30% 以上的带宽增幅1,显著降低了总体拥有成本。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。

基于英特尔的 Xe-HPG 微架构,并由生态系统中的广大硬件供应商和软件开发者提供支持,英特尔数据中心 GPU Flex 系列可以为诸如媒体分析、智慧城市、医疗影像等场景的 AI 推理工作负载提供在 CPU 和 GPU 之间灵活扩展的能力,而不会让开发者受限于封闭的专有软件中。
重要应用:媒体处理、媒体传输、视觉人工智能推理、云游戏和桌面虚拟化等应用场景在数据中心领域呈现快速成长趋势。受此驱动,面向视觉云的数据中心 GPU 芯片市场规模也有望在 2026 年增长至 150 亿美元2。如此快的增长势头,正发生在一个很大程度上受限于封闭的、需要授权许可的代码开发模式的行业中。
Flex 系列 GPU 解决方案堆栈的出现,不仅能突破上述限制,还具备相比于其他解决方案的显著优势,即更高的灵活性和可扩展性,并能降低能耗。它能帮助解决方案提供商们降低总体拥有成本,让他们能够以更少数量的服务器满足更大规模用户的应用需求。
Flex 系列 GPU 解决方案堆栈通过 oneAPI (使用加速计算技术的高效手段)实现,能让开发人员摆脱封闭编程模式带来的经济和技术负担。相较于使用专利语言有可能会令后续开发被锁定在该语言上的局限,oneAPI 是一种开放式的可选方案,它通过一套完整的、经过验证的工具为现有编程语言和并行化模型提供补充,从而充分释放硬件的性能潜力。它让用户得以开发开放的、易于移植的代码,更大限度地利用多种跨英特尔 CPU 和 GPU 的组合。
性能详述:英特尔数据中心 GPU Flex 系列将首先提供媒体处理和传输以及 Android 云游戏相关能力。
媒体处理和传输:视频会议、流媒体和社交媒体的视频处理需求已经改变了数据中心内的计算资源需求。Flex 系列 GPU 的媒体架构包含多达四个 Xe 媒体引擎,专注于满足现代数据中心对于高密度视频流的需求,同时无需妥协质量:

Android 云游戏:云游戏正呈现快速增长趋势,亟需更灵活的解决方案来为用户提供更多的实时游戏流。Flex 系列 GPU 为提供更优的游戏服务质量而打造,可在各种设备上带来畅爽的游戏体验,这一点已经在近 90 款时下热门的 Google Play* Android 游戏中得到验证6。

开放式软件堆栈:开发人员可以访问整合了开源组件和工具的综合软件堆栈,以有效地实现 Flex系列 GPU 面向视觉云工作负载的功能,包括对 oneAPI 和 OpenVINO™ 的支持。英特尔的 oneAPI 工具套件(包括英特尔® oneAPI 视频处理库 oneVPL、英特尔® VTune™ Profiler 等)帮助开发人员能够更快地交付应用程序和服务。
面市计划:包括戴尔科技集团、HPE、新华三、浪潮、联想和超微在内的全球系统提供商将推出搭载 Flex 系列 GPU 的系统。在未来几个月里,从媒体传输和 Android 云游戏工作负载开始,搭载 Flex 系列 GPU 的解决方案将陆续面市。随后将是面向 Windows 云游戏、人工智能和虚拟桌面基础架构工作负载的系统和解决方案8。
###
所有产品计划和路线图可能变更,恕不另行通知。
实际性能受使用情况、配置和其它因素影响而异。更多信息参见性能索引网站。结果可能有所不同。
1) 与 AVC 相比,AV1 节约超过 30% 的带宽,测试中使用的是英特尔®数据中心 GPU Flex 系列 140 和 170。
2) 数据来源:结合来自 IDC、ABI Research、Global Market Insights、Strategy Analytics、Hyperion Research 的数据,由英特尔估算得出。
3) 测试中使用的是英特尔 Flex 系列 140 GPU 在高性能模式下的 HEVC-HEVC 1080p60 转码吞吐量。
4) 测试中使用的是英特尔 Flex 系列 140 GPU 在性能模式下的 HEVC-HEVC 4Kp60 转码吞吐量。
5) 利用英特尔® Deep Link 超级编码实现 8K60 实时转码,测试中使用的是英特尔 Flex 系列 140。
6) 测试时使用了 2022 年 1 月和 2022 年 5 月 Google Play 中热门的 Android 游戏。
7) 选择的安卓游戏包括:
Flex 系列 170 GPU:《王者荣耀》 720p30,68 路数据流。
Flex 系列 140 GPU:《荒野行动》 720p30,46 路数据流。
8) 反映英特尔数据中心 GPU Flex 系列在产品全面成熟之后的性能。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。