[發明專利]語音降噪方法、裝置、設備及介質在審
| 申請號: | 202010522631.5 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111429932A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 丁大為;王哲;嵇望 | 申請(專利權)人: | 浙江遠傳信息技術股份有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0232;G10L21/0264 |
| 代理公司: | 杭州創智卓英知識產權代理事務所(普通合伙) 33324 | 代理人: | 張迪 |
| 地址: | 310051 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 方法 裝置 設備 介質 | ||
1.一種語音降噪方法,其特征在于,包括以下步驟:
獲取語音數據;
對所述語音數據進行預處理,提取預處理后的所述語音數據的多維特征;
將所述多維特征輸入預設語音降噪模型,得到頻帶增益系數及語音活動檢測參數;
當所述語音活動檢測參數為1時,將所述語音數據分為若干頻帶,根據所述頻帶增益系數過濾所述頻帶中的噪音數據;
當所述語音活動檢測參數為0時,將所述頻帶增益系數設為0,并過濾所述頻帶中的噪音數據;
將過濾后的所述語音數據恢復成語音數據流,輸出所述語音數據流。
2.如權利要求1所述的語音降噪方法,其特征在于,獲取語音數據,包括以下步驟:
每隔10ms采集一幀所述語音數據,采樣率為48kHz。
3.如權利要求1所述的語音降噪方法,其特征在于,所述預處理包括:對所述語音數據進行FFT變換。
4.如權利要求1所述的語音降噪方法,其特征在于,將所述語音數據分為若干頻帶,根據所述頻帶增益系數過濾所述頻帶中的噪音數據,包括以下步驟:
通過梳狀濾波器過濾所述語音數據,并根據所述預設語音降噪模型中的頻帶數量,將過濾后的所述語音數據分為若干頻帶;
根據所述頻帶增益系數對每個頻帶的語音數據進行濾波。
5.如權利要求1所述的語音降噪方法,其特征在于,提取預處理后的所述語音數據的多維特征,包括以下步驟:
將每一幀所述語音數據的頻譜劃分為22個不等分頻帶,并對每個所述頻帶的能量進行dct變換,得到22個巴克頻率倒譜系數,作為第一特征;
提取所述第一特征中的前6維特征,計算一階和二階導數,得到12維特征,作為第二特征;
提取所述頻帶的前6個頻帶,進行基因周期dct變換,得到六維特征及1個基因周期系數,作為第三特征;
提取所述頻帶的前8個頻帶,計算所述前八個頻帶的差異值之和,得到1個穩定性系數,作為第四特征;
計算每一幀所述語音數據的幀能量、過零率、延遲一個位置處標準化自相關系數、12階線性預測的第一個系數及12階線性預測誤差,作為第五特征;
所述多維特征包括所述第一特征、所述第二特征、所述第三特征、所述第四特征及所述第五特征。
6.如權利要求1所述的語音降噪方法,其特征在于,所述預設語音降噪模型的訓練過程包括以下步驟:
獲取預先構建的循環神經網絡,所述循環神經網絡包括3個全連接層和3個GRU網絡;
獲取訓練數據,所述訓練數據包括純凈語音數據及噪聲數據;
對所述訓練數據進行分幀處理,并提取每一幀訓練數據的多維特征;
初始化所述循環神經網絡的網絡參數,將所述每一幀訓練數據的多維特征輸入所述循環神經網絡進行模型訓練,并根據損失函數進行模型優化,得到所述預設語音降噪模型。
7.如權利要求6所述的語音降噪方法,其特征在于,將所述多維特征輸入預設語音降噪模型,得到頻帶增益系數,所述頻帶增益系數的計算公式為:,其中gb為所述頻帶增益系數,為純凈語音的能量,為含有噪聲的能量;
所述損失函數計算公式為:,其中為將增益的估計值,γ為感知參數,為頻帶增益系數感知值, 為增益估計值的感知值。
8.一種語音降噪裝置,其特征在于,其包括:
獲取模塊,用于獲取語音數據;
過濾模塊,用于對所述語音數據進行預處理,提取預處理后的所述語音數據的多維特征及語音活動檢測參數;當所述語音活動檢測參數為1時,將所述語音數據分為若干頻帶,根據所述頻帶增益系數過濾所述頻帶中的噪音數據;當所述語音活動檢測參數為0時,將所述頻帶增益系數設為0,并過濾所述頻帶中的噪音數據;
輸出模塊,用于將過濾后的所述語音數據恢復成語音數據流,輸出所述語音數據流。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江遠傳信息技術股份有限公司,未經浙江遠傳信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010522631.5/1.html,轉載請聲明來源鉆瓜專利網。





