[發明專利]一種降噪模型的壓縮方法有效
| 申請號: | 202010266069.4 | 申請日: | 2020-04-07 |
| 公開(公告)號: | CN111599373B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 李慶龍;姜姍 | 申請(專利權)人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L15/06 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 張楠楠 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 壓縮 方法 | ||
本發明的一種降噪模型的壓縮方法,包括如下步驟:步驟1,獲取帶噪訓練語音的特征,根據帶噪語音和對應的純凈語音計算時頻掩蔽mask?r;步驟2,利用特征和對應的時頻掩蔽訓練預設的Teacher模型;步驟3,將訓練數據的特征輸入到預設的Student模型中,在訓練預設的Student模型時,將帶噪的訓練語音特征輸入到訓練好的Teacher模型中獲得mask?t,再將此帶噪的訓練語音的特征輸入到預設的Student模型中得到mask?s,根據mask?r,mask?t和mask?s分別計算loss1,loss2和系數a,得到Loss函數,通過所述loss函數對預設的Student模型進行指導訓練,直至收斂,獲得收斂后的Student模型;步驟4,將帶噪語音輸入到收斂后的Student模型進行計算獲得增強后的語音。本發明的目的在于提供一種降噪性能好、功耗低的降噪模型的壓縮方法。
技術領域
本發明屬于信號處理技術領域,具體涉及一種降噪模型的壓縮方法。
背景技術
語音降噪是將混合語音中的噪聲和人聲分離出來,在盡可能完整保留人聲部分的同時盡可能多的去除噪聲部分。這可以有效提高語音通信或語音交互的質量,使人或機器在嘈雜的環境下也能聽到清晰、干凈的語音。隨著基于深度學習的降噪方法在移動設備上的全面應用,降低模型的參數量的任務也越來越重要。
傳統的降噪方法在非平穩噪聲環境下很難取得很好的效果,尤其對于瞬態的噪聲更是無能為力。當前基于深度學習技術的降噪方法可以有效的去除快變的噪聲,取得更好的語音降噪效果,但模型通常結構復雜,參數量大,對計算資源的消耗比較嚴重。移動設備上運行降噪模型時,對功耗的要求更為苛刻。所以在保證降噪性能幾乎不變的前提下,模型壓縮變的尤為重要。
發明內容
因此,本發明要解決的技術問題在于克服現有技術中在保證降噪性能的前提下,降噪模型難于壓縮的問題。
為此,采用的技術方案是,本發明的一種降噪模型的壓縮方法,包括如下步驟:
步驟1,獲取帶噪訓練語音的特征,根據帶噪語音和對應的純凈語音計算時頻掩蔽mask-r;
步驟2,利用特征和對應的時頻掩蔽訓練預設的Teacher模型;
步驟3,將訓練數據的特征輸入到預設的Student模型中,在訓練預設的Student模型時,將帶噪的訓練語音特征輸入到訓練好的Teacher模型中獲得mask-t,再將此帶噪的訓練語音的特征輸入到預設的Student模型中得到mask-s,根據mask-r,mask-t和mask-s分別計算loss1,loss2和系數a,得到Loss函數,
Loss=a*loss1+(1-a)*?loss2???????????(1)
在利用預設的Student模型預測的mask-s計算loss1,
loss1?=?MSE(mask-r,?mask-s)???????????(2)
利用Teacher模型預測mask-t計算loss2
loss2?=?MSE(mask-t,?mask-s)????????????(3)
再計算權重a,
a=?|mask-r?–?mask-t|?+?0.5,?如果a??1,則a取值為1??(4)
將式(2)、(3)、(4)代入式(1)得
Loss=(|mask-r–mask-t|+0.5)*MSE(mask-r,mask-s)+{1-(|mask-r–mask-t|
+0.5)}*MSE(mask-t,mask-s)
其中MSE為均方誤差函數,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010266069.4/2.html,轉載請聲明來源鉆瓜專利網。





