[發明專利]一種語音增強處理方法有效
| 申請號: | 201811383558.7 | 申請日: | 2018-11-20 |
| 公開(公告)號: | CN109524020B | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 張穎;肖萌萌;徐志京 | 申請(專利權)人: | 上海海事大學 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208 |
| 代理公司: | 上海互順專利代理事務所(普通合伙) 31332 | 代理人: | 成秋麗 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 增強 處理 方法 | ||
1.一種語音增強處理方法,其特征在于,所述方法包括:
基于語音數據與噪聲數據形成訓練樣本;
對所述訓練樣本進行預處理,得到處理后的去噪樣本;
將所述去噪樣本分為多個批次的去噪樣本,分別采用每一個批次的去噪樣本對WGAN模型進行訓練,直至所述多個批次的去噪樣本訓練完成,得到最終的WGAN-MBGD模型;
采用最終的WGAN-MBGD模型輸出增強后的語音信號;
所述將所述去噪樣本分為多個批次的去噪樣本,分別采用每一個批次的去噪樣本對WGAN模型進行訓練,直至所述多個批次的去噪樣本訓練完成,得到最終的WGAN-MBGD模型的步驟,包括:
將所述去噪樣本進行分為多個批次;
基于GAN模型和所述去噪樣本,構建Wasserstein距離函數,最小化Wasserstein距離,得到WGAN模型、WGAN生成器loss函數和WGAN判別器loss函數;針對每一批次去噪樣本執行:對所述WGAN模型進行訓練,得到均方誤差、模型中的權值集合和偏置集合,其中,所述均方誤差是依據樣本輸入下的期望輸出和實際輸出所得到的均方誤差;
直至所述多個批次的去噪樣本訓練完成,得到最終的WGAN-MBGD模型。
2.根據權利要求1所述的語音增強處理方法,其特征在于,所述基于語音數據與噪聲數據形成訓練樣本的步驟,包括:
純凈語音數據與噪聲數據相疊加得到訓練樣本。
3.根據權利要求2所述的語音增強處理方法,其特征在于,所述對所述訓練樣本進行預處理,得到處理后去噪樣本的步驟,包括:
基于語音數據與噪聲數據形成訓練樣本,形成帶噪語音信號,并對所述帶噪語音信號進行短時傅里葉變換,得到變換信號;
通過譜減因子消除噪聲譜峰幅值、譜下限因子填充波谷峰值,以及通過改進的幅度譜減法算法對所述變換信號進行處理,得到處理后的變換信號;
對所述處理后的變換信號進行反傅里葉變換,得到去噪樣本;
所述通過譜減因子消除噪聲譜峰幅值、譜下限因子填充波谷峰值,以及通過改進的幅度譜減法算法對所述變換信號進行處理,得到處理后的變換信號的步驟,包括:
通過改變半波整流本身算法的復雜度,加入譜減因子和譜下限因子,并通過噪聲估計語音信號,得到增強后的語音信號。
4.根據權利要求3所述的語音增強處理方法,其特征在于,所述通過改變半波整流本身算法的復雜度,加入譜減因子和譜下限因子,并通過噪聲估計語音信號,得到增強后的語音信號的步驟,包括:
在語音信號的絕對值不小于噪聲估計的絕對值與譜下限因子的乘積時,確定增強后的語音信號不變,否則,確定增強后的語音信號為噪聲估計的絕對值與譜下限因子的乘積;
其中,所述語音信號為根據樣本信號的絕對值、噪聲估計和譜減因子所得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海海事大學,未經上海海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811383558.7/1.html,轉載請聲明來源鉆瓜專利網。





