英特尔表示,专注于数据中心的Flex系列 GPU(代号Arctic Sound)终于准备就绪,将在未来几个月内开始交付。
近日英特尔在Hot Chips大会上详细介绍说,虽然Flex与英特尔面向人工智能和高性能计算的Ponte Vecchio GPU都采用了类似的Xe核心架构,但Flex系列GPU的目标市场却截然不同,主要针对媒体和游戏流媒体应用这种流密度比计算能力更重要的场景。
Flex GPU本身更接近于英特尔最近宣布的Arc独立系列GPU,但是已经针对数据中心环境进行了调整。Flex GPU配置了多达4个Xe媒体引擎和32个Xe核心以及光线追踪单元,使用Flex GPU的XMX矩阵数学处理器可以实现AI加速功能。
Flex系列GPU有两种规格:75W Flex 140配备了12GB内存,150W Flex 170配备了16GB内存,两者都有PCIe 4.0接口,而且是被动冷却式单插槽GPU。不过TDP较低的型号是半高的,使其能够部署在多达10个GPU的高密度系统中。
据英特尔称,Flex 140的媒体转码吞吐量是英伟达A10 GPU的5倍,解码性能是英伟达A10 GPU的2倍,支持多达36个并发1080p 60fps流或者8个4K 60fps流。而且,对于流媒体应用来说,Flex GPU是线性扩展的,10卡主机能够以该分辨率提供360个同步流或者使用流行的HEVC H.265格式提供80个4K流。
英特尔这一代Flex GPU的一大特点是原生支持AV1编码,而且据英特尔称,这是第一个以数据中心形式提供的GPU。
免版税的编解码器是由包括亚马逊、Netflix和谷歌等几家大型流媒体公司在开放媒体联盟下开发的,与节省空间的HEVC格式相比,该格式有望节省30%的带宽。
英特尔表示,这种流密度显着降低了媒体流和安卓游戏流工作负载的运营成本,提供了对AI流和元宇宙流的适用性。
说到云游戏,英特尔称单个Flex 170能够以720p 30fps的速度提供68个游戏流,并且在发布时已经在将近90款主流安卓游戏中得到了验证。
但是对于人工智能和高性能计算应用来说,英特尔的Flex GPU显得有些不足。据英特尔称,Flex 140在FP32计算中可实现8 teraflops的峰值性能,与英伟达450美金建议零售价A2000相当。与此同时,英特尔的Flex 170在FP32计算中可实现16 teraflops的性能,大约是英伟达A10号称31.2 teraflops性能的一半。
性能数据表明,Flex 140只是本月早些时候英特尔宣布推出的A50工作站GPU的双芯片版本。该卡在半高、双插槽、主动冷却的规格下FP32峰值性能为4.8 teraflops。
未来几个月,将有超过15家OEM作伙伴提供英特尔的Flex系列GPU,包括思科、戴尔科技、HPE、超微、浪潮和H3C。
好文章,需要你的鼓励
宏碁Aspire 14 AI在Costco售价500美元,成为最便宜的Copilot Plus PC。该笔记本搭载英特尔Lunar Lake处理器,拥有现代化配置而非过时组件。配备16GB内存和1TB固态硬盘,电池续航近19小时。虽然设计和显示屏表现一般,但整体性能出色,AI处理能力达到40万亿次操作每秒,是预算有限用户的优质选择。
CORA是微软研究院与谷歌研究团队联合开发的突破性AI视觉模型,发表于2023年CVPR会议。它通过创新的"区域提示"和"锚点预匹配"技术,成功解决了计算机视觉领域的一大挑战——开放词汇目标检测。CORA能够识别训练数据中从未出现过的物体类别,就像人类能够举一反三一样。在LVIS数据集测试中,CORA的性能比现有最佳方法提高了4.6个百分点,尤其在稀有类别识别上表现突出。这一技术有望广泛应用于自动驾驶、零售、安防和辅助技术等多个领域。
博通公司第三季度业绩超预期,每股收益1.69美元,营收159.6亿美元,同比增长22%。公司获得来自新客户的100亿美元定制AI芯片订单,推动股价在盘后交易中上涨超3%。AI相关营收同比增长63%至52亿美元,预计第四季度将超过62亿美元。公司专注为超大规模云基础设施提供商设计定制芯片,已成为英伟达的主要竞争对手之一,年内股价上涨32%,市值超1.4万亿美元。
中国电信研究院联合重庆大学、北航发布T2R-bench基准,首次系统评估AI从工业表格生成专业报告的能力。研究涵盖457个真实工业表格,测试25个主流AI模型,发现最强模型得分仅62.71%,远低于人类专家96.52%。揭示AI在处理复杂结构表格、超大规模数据时存在数字计算错误、信息遗漏等关键缺陷,为AI数据分析技术改进指明方向。