[發明專利]一種基于噪聲分類優化IMCRA算法的語音增強方法在審
| 申請號: | 202011115467.2 | 申請日: | 2020-10-19 |
| 公開(公告)號: | CN112133322A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 張建;尹紅芳;張濤;邵洋洋 | 申請(專利權)人: | 南通賽洋電子有限公司 |
| 主分類號: | G10L21/0264 | 分類號: | G10L21/0264;G10L21/0216;G10L25/21;G10L25/24;G10L25/30;G06N3/08;G06N3/04 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 陳亮亮 |
| 地址: | 226034 江蘇省南通市崇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 噪聲 分類 優化 imcra 算法 語音 增強 方法 | ||
本發明公開了一種基于噪聲分類優化IMCRA算法的語音增強方法,包含以下步驟:針對不同噪聲類型尋找最優的αs、αd和α參數組合,其中αs和αd是IMCRA算法在估計噪聲功率譜時的兩個平滑參數,α是先驗信噪比估計的權重參數;利用卷積神經網絡CNN對輸入信號的噪聲類型進行分類;按照不同的噪聲類型,根據步驟一的尋優結果選擇不同的參數組:αs、αd和α;根據步驟三選定的參數組,利用IMCRA方法對測試集信號進行語音增強,得到最終增強的語音。本發明具有更好的語音增強效果,被增強的語音無論在質量還是可懂度方面均有所提升。
技術領域
本發明涉及一種語音增強方法,特別是一種基于噪聲分類優化IMCRA算法的語音增強方法,屬于語音處理領域。
背景技術
在語音信號的處理過程中,噪聲污染的問題不可避免。因此,如何有效地抑制噪聲,提高語音信號的質量和可懂度成為眾多學者研究的熱點。目前,多種語音增強算法已被提出,主要包括基于信號處理的方法、基于模型訓練的方法和基于統計模型的方法。
在基于信號處理的方法中,譜減法和維納濾波法是兩種最具有代表性的技術。在正確估計背景噪聲的情況下,該類方法能取得較好的分離性能。然而,在低信噪比的條件下,背景噪聲很難準確估計,該類方法性能則大大下降。在基于模型訓練的方法中,深度學習就近年來興起的一種,該類方法在低信噪比、復雜背景噪聲條件下能夠表現較好的效果,但是模型訓練復雜,在實際中難以實用。基于統計模型的方法,在低信噪比的條件下也可以取得比較好的分離性能,同時其相對于模型訓練的方法具有較低復雜度。改進的最小控制遞歸平均(Improved Minima Controlled Recursive Averaging,IMCRA)方法是基于統計模型的方法中性能較好的一個。然而在未知的、不匹配噪聲條件下,傳統的IMCRA算法對噪聲功率譜的估計效果惡化嚴重,并且對提高帶噪信號的可懂度增益效果較小。
發明內容
本發明所要解決的技術問題是提供一種基于噪聲分類優化IMCRA算法的語音增強方法,來獲得質量和可懂度都有所提升的語音。
為解決上述技術問題,本發明所采用的技術方案是:
一種基于噪聲分類優化IMCRA算法的語音增強方法,其特征在于包含以下步驟:
步驟一:針對不同噪聲類型尋找最優的αs、αd和α參數組合,其中αs和αd是IMCRA算法在估計噪聲功率譜時的兩個平滑參數,α是先驗信噪比估計的權重參數;
步驟二:利用卷積神經網絡CNN對輸入信號的噪聲類型進行分類;
步驟三:按照不同的噪聲類型,根據步驟一的尋優結果選擇不同的參數組:αs、αd和α;
步驟四:根據步驟三選定的參數組,利用IMCRA方法對測試集信號進行語音增強,得到最終增強的語音。
進一步地,所述步驟一具體為
1.1對輸入的純凈語音進行去直流處理和幅值歸一化處理;
1.2對純凈語音信號疊加不同種類的噪聲,得到帶噪語音信號;
1.3對于每一類噪聲的帶噪語音信號,進行預處理包括分幀和加窗處理;
1.4對于每一類噪聲的帶噪語音信號,利用固定變量法對參數α進行尋優;
1.5對于每一類噪聲的帶噪語音信號,利用固定變量法分別對參數αs和αd進行尋優。
進一步地,所述1.4具體為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通賽洋電子有限公司,未經南通賽洋電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011115467.2/2.html,轉載請聲明來源鉆瓜專利網。





