该软件定义平台帮助全球广播和流媒体领域的开发者实现 AI 赋能的媒体解决方案。
无论是提供体育直播节目、流媒体服务、网络广播还是社交平台内容,媒体公司都面临着颇具挑战的形势。
越来越多的观众倾向于互动内容和个性化内容;虚拟现实(VR)和增强现实(AR)技术日益成为主流;新的视频压缩标准正在给传统计算基础设施带来挑战;AI 正在产生全方位的影响。
在多变的环境下,媒体公司可以利用 AI 赋能的媒体解决方案灵活满足其不断变化的开发和交付需求,这将使他们获益匪浅。
NVIDIA Holoscan for Media 现已上市,该软件定义平台可帮助开发者轻松构建直播媒体应用,利用 AI 为其增效并部署到各个媒体平台。
全新媒体应用开发方法
Holoscan for Media 提供了一种全新的直播媒体开发方法。它通过提供基于互联网协议(IP)且不受专用硬件、环境或地点限制的云原生架构,来简化应用开发过程。而且该平台还集成了开源技术以及其他受到广泛应用的技术,既简化了向客户交付应用的流程,同时又优化了成本。
直播媒体市场的传统应用开发依赖于专用硬件。由于软件与硬件绑定,开发者在创新或升级应用时会受到限制。
无论是本地部署还是云部署,每种部署都有自己的构造,这使得开发成本变得高昂且低效。除了设计应用的用户界面和核心功能外,开发者还必须构建额外的基础设施服务,这进一步消耗了研发预算。
由于构建 AI 软件堆栈的复杂性,AI 的整合成为了最重大的挑战,阻碍了许多试点项目中的应用投产。
Holoscan for Media 的底层架构可将软件定义视频部署到与 AI 应用(包括生成式 AI 工具)相同的软件堆栈上,降低了将 AI 集成到应用开发中的难度,使想要将 AI 应用整合到直播视频的供应商和研发部门从中受益。
由于 Holoscan for Media 是一个云原生平台,因此无论是在云端、本地还是在边缘,该架构的运行均不受位置限制。除此之外,它不依赖于任何特定设备、现场可编程逻辑门阵列(FPGA)或装置。
Holoscan for Media 架构包含身份验证、日志记录和安全等服务,以及帮助广播公司迁移到基于 IP 的技术的功能,例如 SMPTE ST 2110 传输协议、用于定时和同步的精确时间协议,以及用于动态设备管理的 NMOS 控制器和注册表等。
日益壮大的合作伙伴生态系统
Beamr、Complimato、Lawo、Media.Monks、Pebble、RED Digital Cinema、索尼和 Telestream 等早期采用者正在使用 Holoscan for Media 深入改变直播媒体行业。
软件定义生产工作流提供商 Media.Monks 的创新和创意解决方案高级副总裁 Lewis Smithingham 表示:“我们将 Holoscan for Media 作为我们广播和媒体工作流的核心基础设施,它为我们提供了强大的规模,使我们能够在各种频道和平台上根据观众兴趣提供内容。”
专业数字电影摄影机制造商 RED Digital Cinema 的产品管理副总裁 Jeff Goodman 表示:“Holoscan for Media 将各种应用分门别类,并实现了它们之间的可互操作,这让我们可以在一个平台上轻松采用多家不同公司的最新创新成果。它大幅降低了集成的复杂性并将显著加快创新的步伐。我们十分高兴能够参与其中。”
索尼媒体解决方案业务高级总经理 Masakazu Murata 表示:“我们相信 NVIDIA Holoscan for Media 是推动行业下一代产品和服务发展的途径之一,它让我们可以按需扩展 GPU 能力。我们在 Holoscan for Media 上运行的 M2L-X 软件切换台原型展示了客户如何在 GPU 集群上运行索尼的解决方案。”
数字媒体软件和解决方案提供商 Telestream 高级副总裁兼总经理 Charlie Dunn 表示:“Telestream 致力于改变媒体行业的格局,追求在不牺牲质量和用户友好性的前提下提高效率和内容体验。我们已将 Holoscan for Media 平台无缝集成到我们的 INSPECT IP 视频监控解决方案中,为达到 ST 2110 标准开辟了一条清晰、高效的途径。”
在 NAB Show 上体验 Holoscan for Media
这些合作伙伴将于 4 月 13 日至 17 日在拉斯维加斯举行的广播、媒体和娱乐行业盛会——NAB Show上展示他们如何使用 NVIDIA Holoscan for Media。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。