网易云信亮相LiveVideoStackCon2020，分享RTC中AI音频算法产品化经验

网易云信资深音频算法工程师郝一亚博士受邀参会，在“音频技术：逼近人耳极限”专题会场进行了题为《RTC中AI音频算法的产品化》的主题演讲，并在“5G、AI，新技术与新变革”圆桌论坛中分享了AI在音视频领域应用的实践经验。

10月31日-11月1日，LiveVideoStackCon2020音视频技术大会在北京隆重举办。本次大会以“多媒体开启新视界”为主题，聚焦在音频、视频、图像等技术的最新探索与应用实践，覆盖教育、娱乐、医疗、安防、旅游、电商、社交、游戏、智能设备等行业领域，数十位业内知名讲师与来自全国各地的音视频工程师、多媒体工程师、图像算法工程师、运维与物联网工程师等分享了技术创新与最佳实践。

本次大会中，人工智能相关话题十分火爆，AI已经渗透到多媒体技术的各个环节，无论内容生产、编解码、音视频前后处理等，AI都有一席之地，甚至被寄予厚望。网易云信资深音频算法工程师郝一亚博士受邀参会，在“音频技术：逼近人耳极限”专题会场进行了题为《RTC中AI音频算法的产品化》的主题演讲，并在“5G、AI，新技术与新变革”圆桌论坛中分享了AI在音视频领域应用的实践经验。

主题分享中，郝一亚博士首先介绍了AI在音频处理中日渐强大的力量。随着AI在计算机视觉等领域的成功应用，CNN、RNN等深度学习网络被迅速应用到了音频领域，AI在音频降噪、场景分类、回声控制、盲源分离等方向着发挥着越来越重要的作用。

虽然AI在音频领域的价值日渐明显，但在目前的算法中，特别是RTC音频中，还没有被大范围的应用起来。针对音频处理中AI的挑战与局限，郝一亚博士概括为三点。一是计算复杂度。AI模型通常需要巨大的计算量，就目前我们大部分终端设备的计算能力来说压力很大，对RTC中的实时性提出了考验。二是泛化能力。AI算法是基于有限的数据集训练出来的，泛化能力有限一直是问题所在。而RTC中覆盖的业务场景非常多，AI算法要覆盖所有场景更是难上加难。三是鲁棒性。RTC丰富的应用场景中会有很多突发情况，对于AI算法鲁棒性的要求也非常高。

由于算力、数据和AI模型本身的限制，现在AI还达不到替换传统信号处理方法的阶段，但音频AI在效果上的优势已经被证实。郝一亚博士提出，在RTC领域，要想更好地发挥出AI的优势，有效规避不足，进行“模块化”处理是一个有效的途径。把端到端、长链路的处理拆分，分别找到合适的AI模块，让专业的“人”做专业的事。

以音频降噪中的AI算法为例，传统降噪算法中包含了很多模块，其中“噪声估计”模块很适合做深度学习训练，特别是针对一些稳态噪声。在这里，不用端到端地去训练整个AI模型，而是把这一模块训练成单独的噪声估计模型。通过模块化的处理，实现了轻量级模型、简单的训练目标以及更适合DNN模型，从而最大程度的发挥了AI的优势。

郝一亚博士认为，未来越来越多的AI技术将融入到RTC中，一些新的爆发点可能是更先进的神经网络模型，更高效的GPU等，但是，有一项关键点不会变，那就是大量的数据。目前，网易云信已配备了全套工具和环境采集多种来源的数据集用于训练AI算法，已经在音频降噪和视频超分等场景中实践应用。

2015年10月至今，网易云信一直专注于即时通讯和音视频技术领域的前沿探索和应用实践，已帮助100万企业开发者成功发送10000亿条消息，日活突破3亿，在百家争鸣的PaaS市场中实现稳中增长。近期，网易云信再度加码技术能力，全面升级的音视频通话2.0产品上线，AI等新兴技术已融入产品开始服务客户。未来，网易云信将坚持不断创新，探索融合通讯领域的新技术、新产品、新应用，与行业共创美好新时代。

来源：业界供稿

网易云信

0赞

好文章，需要你的鼓励

网易云信亮相LiveVideoStackCon2020，分享RTC中AI音频算法产品化经验

来源：业界供稿

2020

11/05

16:37

分享

点赞

微软警告：邮件路由配置错误可引发内部域名钓鱼攻击

埃森哲收购英国AI公司Faculty 强化决策智能服务

亚马逊CES发布全新Fire TV界面与Artline彩色边框电视

联想推出跨设备AI智能体，挑战微软和谷歌

麦肯锡和General Catalyst高管：AI时代终结"一次学习，终身受用"模式

联想以AI和数字孪生技术助力2026世界杯

针对D-Link路由器严重远程代码执行漏洞的持续攻击活动

联想Qira AI助手跨设备工作，摩托罗拉AI别针展新机

Deno 2.6新增dx工具运行NPM和JSR二进制文件

西门子CES 2026发布多项技术，加速工业AI革命

Littelfuse推出适用于电动汽车电池、电机和安全系统的汽车级电流传感器

CES 2026 | 机器人开发的“ChatGPT时刻”已到 老黄定调“物理AI”的路线图

文心一言、网易云信、钉钉… 产品技术创新突破奖都有哪些厂商？

无法亲临现场看CBA总决赛？来看看网易云信IM聊天室方案吧！

网易云信携手壹点灵荣获 2022 中国数据智能产业最具社会责任感企业

网易云信 7 周年丨服务超过 150 万开发者，消息量突破 20000 亿条

赛事升级，烽烟正燃！网易云信 Innovation 2022 开发者大赛等你参加！

网易云信圈组功能详解，打造专属“类 Discord ”应用

为教育插上数字化的翅膀，网易云信发布「互联网+教育」整体解决方案

社交内卷时代，网易云信如何用“小游戏”打开破圈新思路

网易云信圈组上线实时互动频道，「破冰」弱关系社交

网易云信亮相 GIAC 全球互联网架构大会，解密新一代音视频架构在元宇宙场景的实践

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

CES 2026 | 机器人开发的“ChatGPT时刻”已到老黄定调“物理AI”的路线图