英特尔表示,专注于数据中心的Flex系列 GPU(代号Arctic Sound)终于准备就绪,将在未来几个月内开始交付。
近日英特尔在Hot Chips大会上详细介绍说,虽然Flex与英特尔面向人工智能和高性能计算的Ponte Vecchio GPU都采用了类似的Xe核心架构,但Flex系列GPU的目标市场却截然不同,主要针对媒体和游戏流媒体应用这种流密度比计算能力更重要的场景。
Flex GPU本身更接近于英特尔最近宣布的Arc独立系列GPU,但是已经针对数据中心环境进行了调整。Flex GPU配置了多达4个Xe媒体引擎和32个Xe核心以及光线追踪单元,使用Flex GPU的XMX矩阵数学处理器可以实现AI加速功能。
Flex系列GPU有两种规格:75W Flex 140配备了12GB内存,150W Flex 170配备了16GB内存,两者都有PCIe 4.0接口,而且是被动冷却式单插槽GPU。不过TDP较低的型号是半高的,使其能够部署在多达10个GPU的高密度系统中。
据英特尔称,Flex 140的媒体转码吞吐量是英伟达A10 GPU的5倍,解码性能是英伟达A10 GPU的2倍,支持多达36个并发1080p 60fps流或者8个4K 60fps流。而且,对于流媒体应用来说,Flex GPU是线性扩展的,10卡主机能够以该分辨率提供360个同步流或者使用流行的HEVC H.265格式提供80个4K流。
英特尔这一代Flex GPU的一大特点是原生支持AV1编码,而且据英特尔称,这是第一个以数据中心形式提供的GPU。
免版税的编解码器是由包括亚马逊、Netflix和谷歌等几家大型流媒体公司在开放媒体联盟下开发的,与节省空间的HEVC格式相比,该格式有望节省30%的带宽。
英特尔表示,这种流密度显着降低了媒体流和安卓游戏流工作负载的运营成本,提供了对AI流和元宇宙流的适用性。
说到云游戏,英特尔称单个Flex 170能够以720p 30fps的速度提供68个游戏流,并且在发布时已经在将近90款主流安卓游戏中得到了验证。
但是对于人工智能和高性能计算应用来说,英特尔的Flex GPU显得有些不足。据英特尔称,Flex 140在FP32计算中可实现8 teraflops的峰值性能,与英伟达450美金建议零售价A2000相当。与此同时,英特尔的Flex 170在FP32计算中可实现16 teraflops的性能,大约是英伟达A10号称31.2 teraflops性能的一半。
性能数据表明,Flex 140只是本月早些时候英特尔宣布推出的A50工作站GPU的双芯片版本。该卡在半高、双插槽、主动冷却的规格下FP32峰值性能为4.8 teraflops。
未来几个月,将有超过15家OEM作伙伴提供英特尔的Flex系列GPU,包括思科、戴尔科技、HPE、超微、浪潮和H3C。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。