11月6日,中国电影电视技术学会2024年学术年会在福州隆重召开。本次年会聚焦于媒体融合、超高清电视及人工智能等前沿议题,汇聚了广电行业的众多专家学者与企业领袖,共同探讨广播影视技术的转型升级与媒体融合的深化发展。紫光股份旗下新华三集团解决方案部运营商技术部总监陈鼎受邀出席主题报告会,深入分享了AI驱动媒体行业数智融合的关键路径,以及新华三赋能媒体新质生产力打造的创新实践。
“1+N”助力打造定制化媒体AIGC应用
当前,AI技术已成为媒体新质生产力的核心引擎。从新闻热点聚合、内容策划到创作和分发,再到传播力分析,AIGC赋能媒体业务全流程,显著提升了生产效率。
然而,在向AI转型的过程中,媒体也面临着诸多挑战,例如算力需求的满足、专属大模型的打造、相关技能的学习、内容安全机制的制定,等等。尽管如此,陈鼎认为,面对AIGC的革命性影响,媒体应积极拥抱变革,充分利用AI技术进行创意转化与精品打造,以更好地满足公众对高品质内容的期待。
作为数字化解决方案领导者,新华三集团持续赋能媒体行业向高清化、移动化、智能化发展,并通过全栈媒体AIGC解决方案,满足客户从智算基础设施到大模型应用的一站式部署。陈鼎表示:“新华三将充分发挥算力和联接双基石的乘数效应,打造算力、存力、运力协同感知的高性能计算集群,满足媒体AIGC对高效算力的需求;同时,通过搭建统一的数据共享平台,实现对行业数据要素的统一治理和管理,为媒体行业的数据驱动决策提供有力支撑。”
新华三坚持以开放的“1+N”大模型策略,为媒体行业客户提供灵活的选择。“1+N”即“1”个百业灵犀(LinSeer)私域大模型和“N”个优选生态大模型。百业灵犀私域大模型以行业专注、区域专属、数据专有、价值专享的理念,为媒体客户提供安全、订制、独享、生长的智能化服务,而优选生态大模型基于丰富的行业数据和应用场景进行定制,能够为客户创造更大的价值。
“新华三媒体AIGC解决方案通过构建AIGC应用智能中枢,实现对多种模型的本地化部署及统一管理调用,全面覆盖媒体用户的AIGC+场景建设。”陈鼎介绍道,“该解决方案实现底层模型能力统一构建、统一管理,模型资源统一分配、应用统一部署、服务统一发布,为用户提供一站式体验。”在应用方面,方案集成文本生成、图片和视频生成、AI数字人及AI音乐等功能,为用户提供了一套高效、完备的内容生产工具。
目前,新华三已经与北京广播电视台、广播电视科学研究院、河南卫视等机构合作,开展AIGC媒体应用创新研究和实践。基于灵犀使能平台、百业灵犀大模型及智算底座,新华三将为媒体智能化建设提供强大技术支持和创新动力。
展望未来,新华三集团将秉持“精耕务实,为时代赋智慧”的理念,以AI技术为引擎,推动数字与智能的深度融合,携手生态合作伙伴,不断探索和创新,赋能媒体行业打造新质生产力,共同迎接智媒新时代的到来。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。