[發明專利]音質控制方法、裝置、設備及存儲介質在審

申請號：	202210511637.1	申請日：	2022-05-10
公開（公告）號：	CN114974279A	公開（公告）日：	2022-08-30
發明（設計）人：	盛劍鋒;周駿華;程寶平	申請（專利權）人：	中移（杭州）信息技術有限公司;中國移動通信集團有限公司
主分類號：	G10L21/0208	分類號：	G10L21/0208;G10L25/30;G10L25/18
代理公司：	深圳市世紀恒程知識產權代理事務所 44287	代理人：	劉瑞花
地址：	311100 浙江省杭州市余***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音質控制方法裝置設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了音質控制方法、裝置、設備及存儲介質，屬于語音處理技術領域。該方法包括基于實時語音降噪模型，對音頻數據進行降噪處理，所述實時語音降噪模型用于根據降噪參數對所述音頻數據進行降噪處理；對降噪處理后的音頻數據進行雙層自動增益控制。也就是說，在本申請中，實時語音降噪模型根據降噪參數對音頻數據進行降噪處理，提高了對音頻數據的降噪效果，并對降噪處理后的音頻數據進行雙層自動增益控制，擴大音量自動增益范圍，提高了音頻數據的音質質量。

技術領域

本申請涉及語音處理技術領域，尤其涉及一種音質控制方法、裝置、設備及存儲介質。

背景技術

在音源和采集設備距離較遠的情況下，噪聲的能量接近甚至超過目標音頻的能量，基于傳統語音降噪方法無法判斷目標音頻和噪聲，導致降噪效果不佳；基于傳統自動增益控制算法無法區分目標音頻和噪聲，無法對目標音頻進行放大，影響目標音頻的主觀聽感質量。也就是說，基于傳統語音降噪方法和傳統自動增益控制算法無法改善遠場音頻的音質質量，導致遠場音頻的音質質量較差。

發明內容

本申請的主要目的在于提供一種音質控制方法、裝置、設備及存儲介質，旨在解決基于傳統語音降噪方法和傳統自動增益控制算法無法改善遠場音頻的音質質量，導致遠場音頻的音質質量較差的技術問題。

為實現上述目的，本申請提供一種音質控制方法，包括以下步驟：

基于實時語音降噪模型，對音頻數據進行降噪處理，所述實時語音降噪模型用于根據降噪參數對所述音頻數據進行降噪處理；

對降噪處理后的音頻數據進行雙層自動增益控制。

可選地，所述基于實時語音降噪模型，對音頻數據進行降噪處理的步驟，包括：

對音頻數據進行噪聲場景判定，確定所述音頻數據對應的噪聲場景；

根據所述噪聲場景獲取與所述噪聲場景匹配的降噪參數；

基于所述降噪參數的實時語音降噪模型，對所述音頻數據進行降噪處理。

可選地，所述基于實時語音降噪模型，對音頻數據進行降噪處理的步驟之前，還包括：

獲取預設噪聲場景對應的音頻訓練數據；

提取所述音頻訓練數據的時域特征值和目標值。