近年来,直播竞答、网络游戏直播等新的实时音视频通讯场景不断推陈出新,并成为引领互联网娱乐风向的弄潮儿。数据显示,2017年中国在线直播用户规模达到38亿,预计2019年用户规模将突破5亿。
实时音视频应用的爆发,也使得WebRTC(Web Real-Time Communication,网页实时通信技术,)技术成为了人们关注的焦点。由于WebRTC技术可以帮助用户在没有插件和客户端的情况下,轻松实现网页浏览器之间的实时语音对话和视频对话,加之研发成本相对较低,因此开源的WebRTC技术逐渐在众多领域得到了广泛应用。
但在WebRTC普及的过程中,一些应用的难点也逐渐呈现。在技术上,如何更好地优化WebRTC,从而为用户带来更高效的实时音视频通讯应用也成为关键。
WebRTC在Web端虽然有着诸多优势,但是作为一项开源技术WebRTC并非完美。例如,面临低带宽、高并发、高丢包等复杂的网络环境时,WebRTC通常都无法保证信息的传输质量。还有可能由于WebRTC的适配问题导致用户无法连麦,或者用户在音视频通话过程中频繁出现回声、啸叫等情况。此外,WebRTC在Web端更加适合点对点的单聊模式,而对于多人音视频会话,尤其是超大群聊的场景没有进一步优化。
针对WebRTC在实际应用中的技术难点,网易云信通过自研全功能工业级音视频框架NRTC(Netease Real-Time Communication)为Web端和移动端的开发提供了完整的音视频技术解决方案。网易云信根据不同行业客户的需求,通过NRTC的WebRTC网关服务器实现高质量的Web端实时音视频通话,进而帮助客户创造更好的用户体验。
在技术端,NRTC实现了Web端和其它移动端、PC端的互通,改善了WebRTC只针对Web端的局限性。NRTC Sever端的QoS优化,则保证了国内弱网环境下的音视频清晰度和流畅度,为用户带来了高质量的使用体验。同时,网易云信做了大量的调优工作,让火狐,Chrome,Safari,Edge等主流浏览器能够轻松适配。优化后的WebRTC也满足了双人点对点和多人会议的使用需求。用户只要接入实时音视频的SDK就可以实现在线教育、在线医疗、游戏直播等多元化的场景功能。
在线音乐教学是在线教育中非常具有技术挑战的一个细分领域,网易云信凭借18年的技术积累与创新,啃下了诸多在线音乐教育背后的技术“硬骨头”。
为了解决中西部网络不稳定引起的卡顿、延时、中断等严重瑕疵,网易云信针对性地使用网络探测和网络状况回调技术,从而可以更加精准判断网络通信状况。此外,网易云信还增加了大量的边缘加速节点,且支持小运营商的接入,为线上教学的规模化应用创造了技术条件。
对于在线音乐等兴趣教学课程而言,用户不仅要求音视频通话需要体现实时的特性,更要求绝对的高质量,例如,音质的流畅性、音质的还原、高低音的细微甄别,以及画面的呈现质量等。为了满足客户的需求,网易云信通过自适应高清音乐模式有效地进行了降噪和回声消除处理。另外,解决方案中还提供了具有画面剪裁功能的SDK,帮助用户自定义画面裁剪比例,以节约流量和降低宽带占用,提高视频流畅度。
在远程医疗领域,传统的视频会议方式很难实现混合录制医患两端的音视频通话,只能分别录制并存放到第三方平台,这样不仅增加了后续调阅查看的难度,也增加了人员手动操作的成本。另外,参与远程诊疗的患者大多分布在偏远地区,而这些地域的网络信号通常很不稳定,进而导致医患沟通的效果很不理想。网易云信针对医疗行业客户的矛盾,提供了音视频流跨网、跨地域稳定、清晰、流畅的传输解决方案。
经过优化和提升,网易云信帮助客户实现了基于UDP 80ms超低延时,并且可支持720P高清画质,满足了用户问诊全程录制与点播的使用需求。网易云信通过部署全球节点,解决了弱网地区网络信号不稳定的问题,并提供了抗800ms的网络抖动,以及抗30%网络丢包的技术优化。除此之外,利用具有独家专利的算法,网易云信提供的解决方案实现了高质量多人实时音视频通话的场景,帮助医生和患者更好的交流。
如今,随着互联网的进一步发展,以及WebRTC的技术的进一步成熟,基于Web端的实时音视频通讯也将会有更多的应用场景以及更大的发展空间。网易云信也将会在实时音视频领域继续深耕,直击实时音视频开发痛点,通过自研的全功能工业级的音视频技术框架NRTC,为各个行业的客户提供更有借鉴意义的创新技术和优质解决方案。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。