英特尔表示,专注于数据中心的Flex系列 GPU(代号Arctic Sound)终于准备就绪,将在未来几个月内开始交付。

近日英特尔在Hot Chips大会上详细介绍说,虽然Flex与英特尔面向人工智能和高性能计算的Ponte Vecchio GPU都采用了类似的Xe核心架构,但Flex系列GPU的目标市场却截然不同,主要针对媒体和游戏流媒体应用这种流密度比计算能力更重要的场景。
Flex GPU本身更接近于英特尔最近宣布的Arc独立系列GPU,但是已经针对数据中心环境进行了调整。Flex GPU配置了多达4个Xe媒体引擎和32个Xe核心以及光线追踪单元,使用Flex GPU的XMX矩阵数学处理器可以实现AI加速功能。
Flex系列GPU有两种规格:75W Flex 140配备了12GB内存,150W Flex 170配备了16GB内存,两者都有PCIe 4.0接口,而且是被动冷却式单插槽GPU。不过TDP较低的型号是半高的,使其能够部署在多达10个GPU的高密度系统中。
据英特尔称,Flex 140的媒体转码吞吐量是英伟达A10 GPU的5倍,解码性能是英伟达A10 GPU的2倍,支持多达36个并发1080p 60fps流或者8个4K 60fps流。而且,对于流媒体应用来说,Flex GPU是线性扩展的,10卡主机能够以该分辨率提供360个同步流或者使用流行的HEVC H.265格式提供80个4K流。
英特尔这一代Flex GPU的一大特点是原生支持AV1编码,而且据英特尔称,这是第一个以数据中心形式提供的GPU。
免版税的编解码器是由包括亚马逊、Netflix和谷歌等几家大型流媒体公司在开放媒体联盟下开发的,与节省空间的HEVC格式相比,该格式有望节省30%的带宽。
英特尔表示,这种流密度显着降低了媒体流和安卓游戏流工作负载的运营成本,提供了对AI流和元宇宙流的适用性。
说到云游戏,英特尔称单个Flex 170能够以720p 30fps的速度提供68个游戏流,并且在发布时已经在将近90款主流安卓游戏中得到了验证。
但是对于人工智能和高性能计算应用来说,英特尔的Flex GPU显得有些不足。据英特尔称,Flex 140在FP32计算中可实现8 teraflops的峰值性能,与英伟达450美金建议零售价A2000相当。与此同时,英特尔的Flex 170在FP32计算中可实现16 teraflops的性能,大约是英伟达A10号称31.2 teraflops性能的一半。
性能数据表明,Flex 140只是本月早些时候英特尔宣布推出的A50工作站GPU的双芯片版本。该卡在半高、双插槽、主动冷却的规格下FP32峰值性能为4.8 teraflops。
未来几个月,将有超过15家OEM作伙伴提供英特尔的Flex系列GPU,包括思科、戴尔科技、HPE、超微、浪潮和H3C。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。