随着前端视频采集设备、视频播放终端的不断升级,以及5G商用化进程的加快,视频行业正在快速进入4K/8K时代,不断为用户带来更出色的视频观看体验。
但4K/8K视频也对视频解码和转码系统的性能,以及总体拥有成本(TCO)带来了严峻的挑战。互联网视频服务提供商和广播电视服务提供商等企业亟需寻找创新的视频解码与转码解决方案,以提升产品在性能和性价比方面的表现。
北京中科大洋科技发展股份有限公司(简称“中科大洋”)成立于1989年,深入发展超高清、媒体融合、媒体云服务等多项业务领域,致力于以视音频、广播电视多媒体为核心的融媒体全生态链技术的研究、开发与应用。
在近日举行的“应云而变,携手加速创新”为主题的英特尔数据中心GPU Flex系列媒体沟通会上,中科大洋技术研究院院长褚震宇分享了英特尔GPU在视频解码与转码方面的创新实践。
软硬协同的英特尔Flex系列GPU
如今,数据量正呈指数级增长,数据形态也日趋多元化。特别是视频内容消费带来的“像素爆炸”给数据中心基础设施带来巨大的压力,传统模式中单一且孤立的计算架构不足以应对。
在不同的计算架构中,GPU的应用场景正在快速增长,除了绘制像素,GPU在人工智能、深度学习和科学计算等领域的应用正在帮助人类解决复杂的计算挑战。
因此,旨在满足智能视觉云的工作负载需求,英特尔提供更出色的媒体转码吞吐性能和支持多达68路实时云游戏流的英特尔数据中心GPU Flex系列。
尤其是英特尔数据中心GPU Flex系列为客户提供的单一GPU解决方案,能够在不牺牲性能或质量的情况下,灵活处理多种工作负载。帮助客户突破孤立且封闭的开发环境的限制,同时降低数据中心对于不得不使用多个分离、独立的解决方案的需求。Flex系列GPU有两种规格:75W的Flex 140配备了12GB内存,150W的Flex 170配备了16GB内存,均已向客户出货。
英特尔数据中心GPU Flex系列内置Xe媒体引擎、XMX AI加速单元和AV1硬件编解码器,可以提供更加出色的视频处理性能表现。借助Deep Link功能,英特尔GPU和CPU可以实现智能地把一部分工作负载放在GPU上,一部分工作负载放在CPU上,这可以提高系统处理各种视频的效率。
除了在硬件层面的创新和突破,英特尔还积极打造开放、全面的软件堆栈。基于英特尔的开源软件工具oneAPI,提供统一的编程架构,包括一整套开发者熟悉的编程语言和标准的跨架构库、工具和框架,使开发人员可以利用oneAPI支持的开放软件堆栈,轻松地开展面向Flex系列GPU的设计工作,充分释放硬件的性能潜力。
视频解码与转码的挑战
高清/超高清视频在为消费者带来更加震撼的视听体验的同时,也为解码和转码系统带来了巨大的性能压力:从高清到4K,视频码率将从高清的100Mbps提升到4K的400~2000Mbps,8K视频的视频码率更是达到4K的4倍以上。码率的提升意味着解码和转码系统承受着更高的压力,系统性能需要实现进一步的提升,以缩短处理时间。
此外,用户对视频服务的及时性也有着越来越高的要求。对于互联网视频服务提供商、广电服务提供商而言,他们需要在尽可能短的时间内实现视频的解码和转码,将内容交付给消费者,并降低解码和转码所带来的性能消耗,以保持在市场中的竞争力。在视频内容快速增长的今天,这将带来巨大的挑战。
从TCO的角度来看,为满足视频解码和转码的算力需求,视频服务提供商常会部署服务器集群。高价格的服务器与大规模的集群会带来巨大成本压力。视频服务提供商希望通过硬件选型、软件优化等多种方式,持续提升视频解码和转码服务的性价比。
中科大洋LeoVideo Cloud是针对高性能视频处理需求设计的专业媒体处理平台,能够为电视台全媒体融合内容生产、IPTV节目点播、OTT多屏点播、手机电视、互联网电视等业务提供优质高效的转码、技审、抽帧、打包、画面内容识别等服务。
褚震宇表示,中科大洋LeoVideo Cloud支持GPU硬件加速,具备高密度高扩展能力,实现以低成本低能耗支持更高的效率。为了进一步加速视频解码和转码性能,同时提升服务的性价比,中科大洋验证了搭载英特尔数据中心GPU Flex 140时,LeoVideo Cloud在视频解码和转码方面的性能表现。
更高的性能与视频质量
测试选用操作系统CentOS 7.4,在双至强6348处理器平台上搭载了75瓦功耗的Flex 140 GPU,使用了广电领域专业测试视频素材来保证测试的严格和严谨性。
而测试结果非常令人满意。首先是高性能,搭载Flex GPU的LeoVideo Cloud能够解码16路4K并发或4路8K并发或60路高清并发。编码方面实现了6路4K并发或30路高清并发。需要重点提及的是,在编码质量上,尤其是在甚低码率编码质量上,英特尔Flex 140较竞品有明显优势。
英特尔数据中心GPU Flex系列包含多达4个Xe媒体引擎、 XMX AI加速单元和AV1硬件编解码器,也是英特尔在数据中心领域首款支持AV1编解码的独立GPU。该系列GPU单卡能够支持多达36路视频流的1080p60转码吞吐量,以及8路视频流的4K60 转码吞吐量,能够以低于同类型解决方案的能耗,提供更出色的媒体转码吞吐性能和解码吞吐性能。
此外,英特尔数据中心GPU Flex系列基于硬件的开源AV1编码器可节省30%以上的带宽。 Flex 140 GPU的媒体引擎还支持包括HEVC、 AVC和VP9在内的业界广泛使用的编解码器,并可以有效提高其性能。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。
其次,Flex系列具有高性价比,使用了英特尔oneAPI工具套件优化,LeoVideo Cloud表现出超越前代N卡平台产品的性能和质量,而且具有更优异的性价比,将非常契合国内电视台及新媒体等主流应用场景。最后,通过提升解码和转码系统的性能和质量,Flex系列GPU实现了有效降低TCO的目标。
英特尔oneAPI工具套件是一种用于多种架构和厂商的编程模型,还提供了多个面向特定领域的工具包,包括英特尔oneAPI渲染工具包和英特尔oneVPL。英特尔oneVPL具备易于使用的视频处理软件开发套件和完整管道演示,可显著加快视频播放、编码、处理和媒体格式转换。
英特尔oneVPL能够使用全面、方便的API对媒体管道进行原型设计、优化和产品化,加快产品上市时间。其使用具有硬件加速功能的高效编解码器来提高AVC、HEVC和MPEG-2的速度、压缩率和质量,加快向新编解码器的过渡。
中科大洋LeoVideo Cloud还支持丰富的英特尔Video Processing Platform(英特尔VPP)特性。英特尔VPP是用于处理视频采集、编解码和显示,以及视频拼接、分割、流式传输、AI推理等的综合平台,可有效加快视频播放、编码、处理和媒体格式转换。中科大洋LeoVideo Cloud通过英特尔VPP,支持基于GEN图形硬件的硬件加速解码、编码和视频后处理功能,在降噪、去隔行、混合、镜像、回转、缩放、颜色格式转换等方面实现了卓越的性能。
谈及未来的规划,褚震宇表示,中科大洋将与英特尔开展更为紧密的合作,致力于实现基于新一代英特尔数据中心GPU Flex的中科大洋LeoVideo Cloud的产品化上市,在高清、超高清时代为消费者带来更加震撼的视听体验,助力提供高性能、高质量、高经济性的视频解码与转码服务。
同时双方还将积极探索,验证英特尔至强可扩展处理器、英特尔数据中心GPU、英特尔oneAPI工具套件等产品与技术在视频领域的应用,助力广电行业 “5G+4K/8K+AI” 的战略格局,聚焦能力提升,不断打造全新亮点产品,在为用户创造更多价值的同时,推动产业发展。
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
研究表明,现有的公开 AI 模型在描述大屠杀历史时过于简单化,无法呈现其复杂性和细微之处。研究人员呼吁各相关机构数字化资料和专业知识,以改善 AI 对这段历史的理解和表述。他们强调需要在 AI 系统中加入更多高质量的数据,同时在审查和信息获取之间寻求平衡。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。