日前有消息显示,为应对复杂声学场景下的实时语音通信技术,解决企业在线会议所遇到的相关问题,腾讯旗下的多媒体实验室推出天籁语音模组方案。据悉,由腾讯多媒体实验室面向实时音视频应用推出的实时音频技术品牌——天籁,是为解决实时音视频应用场景下的各种挑战,并围绕”听得见,听得清,听得真“的目标,构建了一整套围绕音频通信核心体验的技术与框架。
根据官方公布的信息显示,天籁语音模组方案将结合房间声场感知、采集和空间声场重建技术,以解决在会议室复杂场景下的远场多人音频通信、多讲话人实时追踪、多人自动取景等实时音视频技术方面的难题。例如针对因人与音视频设备距离导致听不清及听不到的问题,其将多个MEMS麦克风板嵌入到会议大屏中,结合音频处理器,可以实现180度广角及12米的超长距离拾音能力。
此外针对远程会议中产生的声音卡顿、声音忽快忽慢、多人同时说话时声音失真而影响会议进程等问题,该方案将设备上行时延降低至几十毫秒,可实现双讲无剪切、无回声泄露、无近端语音抑制,让远程多人语音交流如实时一般。此外,其还基于深度学习模型,将空调声、风扇声等平稳噪声的降噪深度提高至40dB,并且对会议室场景下的各种突发噪声进行针对性消除,以提升语音信噪比。
据悉,目前该方案将应用于腾讯会议Rooms专款机型,并已率先授权开放给腾讯会议Rooms专款硬件合作伙伴。与此同时,腾讯会议还将通过开放音视频认证标准,联合硬件设备厂商共同为企业打造“软硬一体”的云视频会议解决方案。
【本文图片来自网络】