如今,数据量正呈指数级增长,数据形态也日趋多元化。特别是视频内容消费带来的“像素爆炸”给数据中心基础设施带来巨大的压力,传统模式中单一且孤立的计算架构不足以应对。
在此背景下,英特尔基于XPU战略打造了跨CPU、GPU、FPGA、IPU等多种架构的算力资源支持未来的应用。其中,最新的英特尔Flex系列GPU采用了突破性设计,可以应对算力挑战、满足新兴智能视觉云负载所需的多项软硬件创新及突出的灵活性和可扩展性。
英特尔公司市场营销集团副总裁、中国区云与行业解决方案部总经理梁雅莉表示,在不同的计算架构中,GPU的应用场景正在快速增长,除了绘制像素,GPU在人工智能、深度学习和科学计算等领域的应用正在帮助人类解决复杂的计算挑战。
因此,英特尔推出了专为消费端打造,致力于为全球游戏玩家和创作者不断打造卓越体验的英特尔锐炫(Intel Arc)高性能显卡产品品牌;旨在满足智能视觉云的工作负载需求,提供更出色的媒体转码吞吐性能和支持多达68路实时云游戏流的英特尔数据中心GPU Flex系列。
尤其是英特尔数据中心GPU Flex系列为客户提供的单一GPU解决方案,能够在不牺牲性能或质量的情况下,灵活处理多种工作负载。帮助客户突破孤立且封闭的开发环境的限制,同时降低数据中心对于不得不使用多个分离、独立的解决方案的需求。Flex系列GPU有两种规格:75W的Flex 140配备了12GB内存,150W的Flex 170配备了16GB内存,均已向客户出货。
领先技术覆盖更多应用场景
英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰表示,基于全方位的硬件和软件创新,英特尔数据中心GPU Flex系列可以灵活处理媒体处理与传输、云游戏、AI推理、VDI多种云工作负载,有效优化使用者的总体拥有成本。
英特尔数据中心GPU Flex系列包含多达4个Xe媒体引擎、 XMX AI加速单元和AV1硬件编解码器,也是英特尔在数据中心领域首款支持AV1编解码的独立GPU。该系列GPU单卡能够支持多达36路视频流的1080p60转码吞吐量,以及8路视频流的4K60转码吞吐量,能够以低于同类型解决方案的能耗,提供更出色的媒体转码吞吐性能和解码吞吐性能。
此外,英特尔数据中心 GPU Flex系列基于硬件的开源AV1编码器可节省30%以上的带宽。Flex 140 GPU的媒体引擎还支持包括HEVC、AVC和VP9在内的业界广泛使用的编解码器,并可以有效提高其性能。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。
庄秉翰介绍说,借助Deep Link功能,英特尔GPU和CPU可以实现智能地把一部分工作负载放在GPU上,一部分工作负载放在CPU上,这可以提高系统处理各种视频的效率。Flex系列GPU产品支持硬件的SR-IOV,客户进行VDI时,不用额外再付软件的授权费用,这个对节省总拥有成本非常有利。
除了在硬件层面的创新和突破,英特尔还积极打造开放、全面的软件堆栈。基于英特尔的开源软件工具oneAPI,提供统一的编程架构,包括一整套开发者熟悉的编程语言和标准的跨架构库、工具和框架,使开发人员可以利用oneAPI支持的开放软件堆栈,轻松地开展面向Flex系列GPU的设计工作,充分释放硬件的性能潜力。
英特尔亚洲AI及视觉计算销售技术高级总监伊红卫表示,对于上层应用的客户,英特尔希望对于广大的开发者来说底层架构是无感的、透明的。oneAPI帮助用户开发开放的、易于移植的代码,更大限度利用多种跨英特尔硬件平台的组合,例如CPU和GPU,并打破跨架构计算的平台壁垒。
广泛生态打造多样化解决方案
任何产品的成功,离不开产业上下游的通力合作。庄秉翰表示,英特尔的强项就是对整个产业链生态伙伴的推广和支持。
结合硬件方面的独特优势以及对于开放软件生态系统的投入,仅仅上市数月,英特尔数据中心GPU Flex系列在国内已通过搭载新华三、浪潮、宁畅、宝德、超聚变4等众多OEM合作伙伴的系统陆续面市。
同时在当虹科技、中科大洋、火山引擎、亿联网络等行业合作伙伴的实际使用场景中实现了针对不同视觉云工作负载的应用部署落地,在此过程中也获得了来自中国联通、天翼云、移动云的电信运营商的支持,整体生态呈现良好增长势头。
例如,在媒体处理与传输方面,中科大洋利用英特尔数据中心GPU Flex 140,并使用涵盖英特尔oneVPL在内的英特尔oneAPI工具套件进行优化,其LeoVideo Cloud在多媒体转码和视觉图形处理等方面能够实现解码16路4K并发或4路8K并发或60路高清并发,以及编码6路4K并发或30路高清并发,这一性能表现远超传统产品,而且具有更优异的性价比。
为了打造全新数字化办公空间,追求行业前沿音视频技术,亿联网络运用Flex系列GPU的能力,全面升级了视频会议系统中的音视频性能,为用户带来如临其境的全能智会体验。
云游戏正呈现快速增长趋势,亟需更灵活的解决方案来为用户提供更多的实时游戏流。Flex系列GPU为提供更优的游戏服务质量而打造,可在各种设备上带来畅爽的游戏体验。
在火山引擎技术支持的3D动作手游《航海王热血航线》中,Flex系列GPU以强大的图形渲染能力和多媒体编解码能力带来了流畅度、画质等方面提升。单个Flex系列140 GPU可支持渲染20路720p60数据流,编码60路720p60数据流。Flex系列GPU提供了更多路实时云游戏流,保证了更优的游戏服务质量。值得一提的是,Flex系列GPU的应用也可以显著降低总体拥有成本,能够以更多游戏路数和更少的基础架构为用户带来畅爽的云游戏体验。
随着新媒体的高速发展,各种显示设备的分辨率不断提高,人们对于影片清晰度的要求也越来越高。以AI画质增强技术为代表的技术革新,也让视频超分、插帧等算法在老片修复及4K生成等场景中得到广泛应用。基于此,当虹科技与英特尔开展合作,升级了一套用于老胶片电影修复、重要历史资料纪录片翻新和大数据人文素材修复等场景的解决方案。
“一个好的产品的推广,需要合作伙伴一起共同努力建立生态。业界非常期待在GPU上有不同的选择,因为有竞争才会有进步,除了我们的伙伴,还有我们的客户都非常期待,也非常愿意测试英特尔的GPU产品。”庄秉翰最后说。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。