[發明專利]單聲道語音降噪方法、系統、設備及可讀存儲介質在審
| 申請號: | 202011534575.3 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112614504A | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 王健宗;程寧;張之勇 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10L25/30 |
| 代理公司: | 北京中巡通大知識產權代理有限公司 11703 | 代理人: | 郭瑤 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 單聲道 語音 方法 系統 設備 可讀 存儲 介質 | ||
1.一種單聲道語音降噪方法,其特征在于,包括以下步驟:
獲取待降噪的單聲道語音;
構建基于LSTM神經網絡的初始降噪模型;
獲取預設數量的增強訓練樣本,采用預設數量的增強訓練樣本訓練初始降噪模型,得到降噪模型;
通過降噪模型將待降噪的單聲道語音降噪,得到人聲音頻。
2.根據權利要求1所述的單聲道語音降噪方法,其特征在于,所述構建基于LSTM神經網絡的初始降噪模型包括:
獲取若干人聲音頻和若干噪音音頻并隨機組合,得到若干混合音頻,各混合音頻中均包括一人聲音頻及至少一個噪音音頻;
將混合音頻進行分幀加窗處理及傅里葉變換,得到若干混合音頻幀頻譜;
將若干混合音頻幀頻譜分為訓練集和測試集,建立用于二分類的LSTM神經網絡模型,通過訓練集訓練LSTM神經網絡模型,通過測試集測試訓練后的LSTM神經網絡模型,當測試結果的合格率符合預設的合格率閾值時測試合格,得到初始降噪模型。
3.根據權利要求2所述的單聲道語音降噪方法,其特征在于,所述通過訓練集訓練LSTM神經網絡模型包括:
將訓練集內的混合音頻幀頻譜輸入LSTM神經網絡模型,得到人聲頻譜和噪音頻譜并進行逆傅里葉變換,得到預測的人聲音頻及噪音音頻;
根據預測的人聲音頻與實際的人聲音頻之間的誤差,迭代更新LSTM神經網絡模型中的各參數,至訓練次數達到預設值或預測的人聲音頻與實際的人聲音頻之間的誤差不再下降。
4.根據權利要求1所述的單聲道語音降噪方法,其特征在于,所述獲取預設數量的增強訓練樣本,采用預設數量的增強訓練樣本訓練初始降噪模型包括:
獲取若干初始降噪模型降噪不合格的單聲道語音,作為預設數量的增強訓練樣本;
獲取若干通過人聲音頻和若干噪音音頻組合形成的測試樣本;
采用無監督學習的方式,通過預設數量的增強訓練樣本訓練初始降噪模型,至訓練后的初始降噪模型對測試樣本的降噪效果與初始降噪模型對測試樣本的降噪效果在預設誤差內,且訓練后的初始降噪模型對增強訓練樣本的降噪效果大于初始降噪模型對增強訓練樣本的降噪效果預設閾值。
5.根據權利要求4所述的單聲道語音降噪方法,其特征在于,所述通過預設數量的增強訓練樣本訓練初始降噪模型時,將初始降噪模型中若干隱藏層的參數固定。
6.根據權利要求4所述的單聲道語音降噪方法,其特征在于,所述通過預設數量的增強訓練樣本訓練初始降噪模型前,在初始降噪模型的隱藏層與分類層之間添加若干隨機非線性層。
7.根據權利要求1所述的單聲道語音降噪方法,其特征在于,所述通過降噪模型將待降噪的單聲道語音降噪,得到人聲音頻包括:
將待降噪的單聲道語音進行傅里葉變換,得到通話語音頻譜;
將通話語音頻譜輸入降噪模型,得到人聲頻譜和噪音頻譜;
將人聲頻譜進行逆傅里葉變換,得到人聲音頻。
8.一種單聲道語音降噪系統,其特征在于,包括:
獲取模塊,用于獲取待降噪的單聲道語音;
模型構建模塊,用于構建基于LSTM神經網絡的初始降噪模型;
增強訓練模塊,用于獲取預設數量的增強訓練樣本,采用預設數量的增強訓練樣本訓練初始降噪模型,得到降噪模型;以及
降噪模塊,用于通過降噪模型將待降噪的單聲道語音降噪,得到人聲音頻。
9.一種終端設備,其特征在于,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現權利要求1至7任一項所述單聲道語音降噪方法的步驟。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7任一項所述單聲道語音降噪方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011534575.3/1.html,轉載請聲明來源鉆瓜專利網。





