腾讯多媒体实验室天籁AI音频技术“破圈”背后的 - 分析试验室杂志社投稿_期刊论文发表|版面费|电话|编辑部|论文发表- 分析试验室

来稿应自觉遵守国家有关著作权法律法规，不得侵犯他人版权或其他权利，如果出现问题作者文责自负，而且本刊将依法追究侵权行为给本刊造成的损失责任。本刊对录用稿有修改、删节权。经本刊通知进行修改的稿件或被采用的稿件，作者必须保证本刊的独立发表权。一、投稿方式： 1、请从我刊官网直接投稿。 2、请从我编辑部编辑的推广链接进入我刊投审稿系统进行投稿。二、稿件著作权： 1、投稿人保证其向我刊所投之作品是其本人或与他人合作创作之成果，或对所投作品拥有合法的著作权，无第三人对其作品提出可成立之权利主张。 2、投稿人保证向我刊所投之稿件，尚未在任何媒体上发表。 3、投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、投稿人向我刊所投之作品不得同时向第三方投送，即不允许一稿多投。 5、投稿人授予我刊享有作品专有使用权的方式包括但不限于：通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑，以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、第5条所述之网络是指通过我刊官网。 7、投稿人委托我刊声明，未经我方许可，任何网站、媒体、组织不得转载、摘编其作品。

腾讯多媒体实验室天籁AI音频技术“破圈”背后的

作者:

关键词:

摘要：

本文转自【经济日报】；

10月31日，由LiveVideoStack举办的以“多媒体开启新视界”为主题的LiveVideoStackCon 2020北京站如期召开。作为多媒体技术领域的盛会，大会聚焦在音频、视频、图像等技术的最新探索与应用实践，覆盖教育、娱乐、医疗、安防、交通、制造、旅游、电商、金融、社交、游戏、智能设备、IC等行业领域。会上，腾讯多媒体实验室专家研究员肖玮进行了《腾讯天籁：“下行最后一厘米” 音频体验提升》主题分享，重点介绍了腾讯天籁如何将经典信号处理技术与深度学习进行有机融合，围绕网络下行终端，提升音频体验。

腾讯天籁音频AI技术，打造端到端的音频通信体验

年初的疫情黑天鹅事件，让数字通信手段成为了人与人沟通的重要手段，同时也对实时音视频通信的稳定性和通讯效果带来了极大考验。肖玮指出，为了解决实时音视频应用场景下的各种挑战，腾讯多媒体实验室围绕音频通信核心体验的技术和框架进行了多年的探索。在今年9月份举办的腾讯全球数字生态大会上，正式发布了“面向实时音视频应用的新一代实时音频技术品牌”——腾讯天籁。该解决方案旨在提供实时端到端音频通信的完整解决方案，致力于让用户在实时音视频会议时可以“听得见，听得清，听得真”。

肖玮表示，RTC场景复杂、处理链条长；每个节点均会影响用户的终极体验。然而，下行终端侧，是最接近于用户的终级体验的节点；如果进行合理的设计，可以非常高效地提升用户的终极体验。因此，腾讯天籁提出“下行最后一厘米”音频体验提升的概念，将经典的音频信号处理和深度学习技术结合，设计并实现了基于上下文分析的前向纠错、丢包补偿方案。信源侧单独可抗40%丢包率，整体方案可抗80%丢包率。用户在弱网环境下的通话体验可以获得极大保障。

基于领先的腾讯天籁音频解决方案，腾讯天籁不仅可以让不同地点、场景、设备终端同时远程接入，让远程线上沟通更加高效，并且还扩展了实时音频的语音带宽。与传统PSTN电话音质相比，使用了腾讯天籁技术后的音频音质更加明亮、干净。同时，整套音频算法能力也进行了有针对性的优化，可以在用户多种客户端进行部署，最终提升了音频通信的可懂度、自然度、舒适度。

此外，以腾讯会议为例，肖玮现场展示了基于深度学习的语音增强方案在真实场景中的增强效果。在长达两分钟的展示环节，分别演示了地铁站、菜市场、街道等多种噪声场景。在这些场景下，腾讯天籁基于深度学习语音增强方案均能提供高质量的处理效果，现场展示获得现场观众的广泛关注。

另一方面，肖玮强调了端到端质量评价和认证体系的建立，对RTC场景下的体验提升也是非常关键的。截止目前，腾讯多媒体实验室已经建立了完整的端到端通话质量评价和认证体系。借助这一体系，腾讯天籁品牌下的各种技术，在产品落地前，均要通过该体系的严格测试。此外，在技术的研发过程中，该体系的测试结果，可以给研究人员提供非常重要参考信息，用于方案的打磨和优化。

从技术到公益，腾讯天籁“技术外溢”的产品力

目前，腾讯天籁已经在腾讯会议、腾讯云、全民K歌、微视等腾讯内外部产品、场景中广泛应用落地，并助力相关应用在音视频体验方面取得了良好的用户口碑。

不仅如此，在腾讯的一些无障碍项目交流当中，腾讯多媒体实验室的团队成员们了解到听障人士即使佩戴了人工耳蜗，在机场、商场等比较嘈杂的公共环境中，依然面临“听不清”的困扰。基于此，腾讯多媒体实验室联合国内最大的人工耳蜗厂商之一—诺尔康(Nurotron)一起展开相关讨论和研究，经过长达半年的技术验证，从架构上最终确定了“手机伴侣+人工耳蜗”的联合解决方案。通过多种技术的优化和整合，实现了语音清晰度和可懂度提升40%的效果。经过提升后的信号，传递给人工耳蜗后，可以极大改善听障人士的听觉体验，让听障人士在“听得见”的基础上“听得清、听得真”。

9月27日国际聋人日之际，腾讯多媒体实验室联合腾讯公益慈善基金会、深圳市信息无障碍研究会等机构召开发布会，宣布发起“天籁行动”，通过面向公益开发者、设备厂商、NGO及行业免费开放腾讯天籁AI音频技术，帮助听障人群解决“听不清”难题，并邀请歌手周深作为公益大使，呼吁全社会关注听障人士身心康复，构建信息无障碍环境。

文章来源：《分析试验室》网址: http://www.fxsys.cn/zonghexinwen/2020/1102/603.html