英特尔表示,专注于数据中心的Flex系列 GPU(代号Arctic Sound)终于准备就绪,将在未来几个月内开始交付。
近日英特尔在Hot Chips大会上详细介绍说,虽然Flex与英特尔面向人工智能和高性能计算的Ponte Vecchio GPU都采用了类似的Xe核心架构,但Flex系列GPU的目标市场却截然不同,主要针对媒体和游戏流媒体应用这种流密度比计算能力更重要的场景。
Flex GPU本身更接近于英特尔最近宣布的Arc独立系列GPU,但是已经针对数据中心环境进行了调整。Flex GPU配置了多达4个Xe媒体引擎和32个Xe核心以及光线追踪单元,使用Flex GPU的XMX矩阵数学处理器可以实现AI加速功能。
Flex系列GPU有两种规格:75W Flex 140配备了12GB内存,150W Flex 170配备了16GB内存,两者都有PCIe 4.0接口,而且是被动冷却式单插槽GPU。不过TDP较低的型号是半高的,使其能够部署在多达10个GPU的高密度系统中。
据英特尔称,Flex 140的媒体转码吞吐量是英伟达A10 GPU的5倍,解码性能是英伟达A10 GPU的2倍,支持多达36个并发1080p 60fps流或者8个4K 60fps流。而且,对于流媒体应用来说,Flex GPU是线性扩展的,10卡主机能够以该分辨率提供360个同步流或者使用流行的HEVC H.265格式提供80个4K流。
英特尔这一代Flex GPU的一大特点是原生支持AV1编码,而且据英特尔称,这是第一个以数据中心形式提供的GPU。
免版税的编解码器是由包括亚马逊、Netflix和谷歌等几家大型流媒体公司在开放媒体联盟下开发的,与节省空间的HEVC格式相比,该格式有望节省30%的带宽。
英特尔表示,这种流密度显着降低了媒体流和安卓游戏流工作负载的运营成本,提供了对AI流和元宇宙流的适用性。
说到云游戏,英特尔称单个Flex 170能够以720p 30fps的速度提供68个游戏流,并且在发布时已经在将近90款主流安卓游戏中得到了验证。
但是对于人工智能和高性能计算应用来说,英特尔的Flex GPU显得有些不足。据英特尔称,Flex 140在FP32计算中可实现8 teraflops的峰值性能,与英伟达450美金建议零售价A2000相当。与此同时,英特尔的Flex 170在FP32计算中可实现16 teraflops的性能,大约是英伟达A10号称31.2 teraflops性能的一半。
性能数据表明,Flex 140只是本月早些时候英特尔宣布推出的A50工作站GPU的双芯片版本。该卡在半高、双插槽、主动冷却的规格下FP32峰值性能为4.8 teraflops。
未来几个月,将有超过15家OEM作伙伴提供英特尔的Flex系列GPU,包括思科、戴尔科技、HPE、超微、浪潮和H3C。
好文章,需要你的鼓励
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。