[發明專利]一種語音降噪方法有效
| 申請號: | 201811379108.0 | 申請日: | 2018-11-19 |
| 公開(公告)號: | CN109378013B | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 郝小龍;韓斌;樊強;彭啟偉;薛依銘;王學廣;賈政;張鐵勛;崔漾 | 申請(專利權)人: | 南瑞集團有限公司;南京南瑞信息通信科技有限公司 |
| 主分類號: | G10L21/0264 | 分類號: | G10L21/0264;G10L21/0232;G10L25/21;G10L25/87 |
| 代理公司: | 成都弘毅天承知識產權代理有限公司 51230 | 代理人: | 馬林中 |
| 地址: | 211100 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 方法 | ||
1.一種語音降噪方法,包括基于神經網絡模型的深度降噪模型,其特征在于:還包括以下步驟:
A、對帶噪語音信號進行預處理得到預處理過的語音信號;
B、使用語音端點檢測技術VAD對步驟A中預處理過的語音信號進行端點檢測,根據信號的短時能量和過零率,確定該段語音信號的有效起點和終點;
C、根據步驟B檢測到語音信號的有效起點和終點,剪裁整個語音信號;
D、將步驟C中裁剪后的語音信號轉換為預定格式的帶噪語音信號;
E、將步驟D中預定格式的帶噪語音信號切片成固定長度;
F、將步驟E中的帶噪語音信號切片作為深度降噪模型的輸入,通過深度降噪模型,得到干凈的語音信號;
所述基于神經網絡模型的深度降噪模型的訓練包括以下步驟:
G1、采集帶噪語音樣本,將帶噪語音樣本依次執行步驟A、B、C后得到干凈語音樣本,根據帶噪樣本的VAD結果剪裁對應的干凈語音樣本;
G2、將步驟G1中的干凈語音樣本和帶噪語音樣本都執行步驟D、E得到干凈語音樣本切片和帶噪語音樣本切片;
G3、將上述處理好的帶噪語音樣本切片作為神經網絡的輸入,將對應干凈語音樣本切片作為神經網絡輸出,訓練神經網絡得到基于神經網絡模型的深度降噪模型。
2.根據權利要求1所述的一種語音降噪方法,其特征在于:所述步驟A中對帶噪語音信號進行預處理的方法包括以下步驟:
A1、對輸入的帶噪語音信號進行加窗處理,將連續的語音信號拆分成語音幀;
A2、對每一幀語音信號進行快速傅里葉變換FFT,將時域信號轉換到頻域;
A3、使用傳統的頻域信號處理方法對每一幀頻域信號進去噪處理;
A4、將步驟A3中進去噪處理結果進行反傅里葉變換,將頻域信號轉換為時域信號得到預處理后的語音幀;
A5、對步驟A4中得到預處理后的語音幀進行合成,得到的信號為預處理過的語音信號。
3.根據權利要求1所述的一種語音降噪方法,其特征在于:所述步驟D中的預定格式包括預定頻率、預定量化級和預定調制方法。
4.根據權利要求1所述的一種語音降噪方法,其特征在于:本方法用于個人或有限數量的用戶時,步驟G1中的帶噪語音樣本采用對應用戶的帶噪語音樣本。
5.根據權利要求1所述的一種語音降噪方法,其特征在于:本方法用于個人或有限數量的用戶時,步驟G1對應用戶的干凈語音樣本,通過合成得到帶噪語音樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南瑞集團有限公司;南京南瑞信息通信科技有限公司,未經南瑞集團有限公司;南京南瑞信息通信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811379108.0/1.html,轉載請聲明來源鉆瓜專利網。





