[發明專利]頻帶增益模型的訓練方法及用于車載場景的語音降噪方法在審
| 申請號: | 202110985541.4 | 申請日: | 2021-08-26 |
| 公開(公告)號: | CN113782011A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 姜彥吉;張勝;宋湘鈺;范佳亮;彭博 | 申請(專利權)人: | 清華大學蘇州汽車研究院(相城) |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/16;G10L15/20;G10L21/0208;G10L25/24;G10L25/30;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州創元專利商標事務所有限公司 32103 | 代理人: | 喬峰 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 頻帶 增益 模型 訓練 方法 用于 車載 場景 語音 | ||
1.一種頻帶增益模型的訓練方法,其特征在于,所述頻帶增益模型基于神經網絡模型,采用SRU架構,所述頻帶增益模型能夠依據帶噪語音信號的特征值對其多個頻段的信號進行降噪增益;
所述訓練方法包括以下步驟:
S1、將純語音信號和純噪聲信號分別分幀后,并逐幀按照頻率進行分帶,得到n個純語音頻帶和n個純噪聲頻帶,計算各純語音頻帶和各純噪聲頻帶的能量;將所述純語音信號和純噪聲信號混合后,得到帶噪語音信號,對其進行分幀處理,并逐幀按照相應頻率進行分帶,得到n個帶噪語音頻帶,計算各帶噪語音頻帶的能量;
根據各純噪聲頻帶的能量,以得到所述純噪聲頻帶相應的n個對數譜;
根據所述純語音頻帶的能量與相應頻段的所述帶噪語音頻帶的能量的比值,以得到n個增益期望值;
根據各帶噪語音頻帶的能量,得到相應的對數功率譜,并通過反離散余弦變換得到n個MFCC系數,以作為所述帶噪語音頻帶相應的n個特征值;
S2、將所述n個特征值輸入所述頻帶增益模型,以輸出各帶噪語音頻帶對應的增益值,并利用所述增益期望值以及所述對數譜作為標簽進行神經網絡訓練,以實現對所述頻帶增益模型的參數優化。
2.根據權利要求1所述的頻帶增益模型的訓練方法,其特征在于,所述頻帶增益模型包括第一SRU層、第二SRU層、第三SRU層、第四SRU層、第五SRU層、第一全連接層和第二全連接層,
所述特征值輸入至所述第一SRU層,使用tanh激活函數處理后輸出;
所述特征值輸入至所述第一全連接層,使用tanh激活函數處理后輸出至所述第二SRU層,在所述第二SRU層,使用Relu激活函數處理后輸出至所述第三SRU層;
在所述第三SRU層中,對所述第一全連接層的輸出和第二SRU層的輸出使用Relu激活函數處理后輸出;
在所述第四SRU層中,對所述第一SRU層的輸出和第三SRU層的輸出使用Relu激活函數處理后輸出;
在所述第五SRU層中,對所述第一SRU層的輸出、第三SRU層的輸出和第四SRU層的輸出使用Relu激活函數處理后輸出;
在所述第二全連接層中,對所述第五SRU層的輸出使用sigmoid激活函數處理后輸出,以得到所述帶噪語音頻帶的增益值。
3.根據權利要求2所述的頻帶增益模型的訓練方法,其特征在于,所述第二SRU層中的SRU單元能夠進行并行計算,并能通過遺忘門更新隱藏態。
4.根據權利要求1所述的頻帶增益模型的訓練方法,其特征在于,對所述帶噪語音信號的各幀進行清音判斷及處理,以得到其基音周期值,并將所述基音周期值作為新增特征值輸入至所述頻帶增益模型一起進行訓練。
5.根據權利要求4所述的頻帶增益模型的訓練方法,其特征在于,根據所述基音周期值,得到所述帶噪語音信號對應的基音信號帶,計算所述基音信號帶的能量,并結合所述帶噪語音頻帶的能量一起做離散余弦變換,以得到關聯參數,將其作為新增特征值輸入至所述頻帶增益模型一起進行訓練。
6.根據權利要求1所述的頻帶增益模型的訓練方法,其特征在于,對所述特征值做一階導數和/或二階導數處理,將得到的結果作為新增特征值輸入至所述頻帶增益模型一起進行訓練。
7.根據權利要求1所述的頻帶增益模型的訓練方法,其特征在于,所述純語音信號、純噪聲信號和帶噪語音信號均才采用梅爾濾波器進行分帶。
8.一種適用于車載場景的語音降噪方法,其特征在于,包括以下步驟:
P1、將帶噪語音進行分幀處理,并逐幀按照頻率進行分帶,得到m個帶噪語音頻帶,提取其對應的m個特征值,并輸入權利要求1-7中任一項所述的頻帶增益模型,以得到所述帶噪語音頻帶對應的增益值;
P2、采用梳狀濾波器對所述帶噪語音頻帶進行基音濾波;
P3、計算所述帶噪語音頻帶濾波后的能量,以得到所述帶噪語音頻帶在濾波前后的能量比值;
P4、將所述帶噪語音頻帶濾波后的信號與所述能量比值相乘,再與所述帶噪語音頻帶對應的增益值相乘,以得到降噪后語音數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學蘇州汽車研究院(相城),未經清華大學蘇州汽車研究院(相城)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110985541.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種低徐變型高效聚羧酸減水劑及其制備方法
- 下一篇:一種煙塵除硝除硫環保設備





