[發明專利]一種模型訓練方法、裝置和用于模型訓練的裝置在審
| 申請號: | 202110942719.7 | 申請日: | 2021-08-17 |
| 公開(公告)號: | CN113707134A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 王森茂;周盼;王智超;王佳文 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/02;G10L15/20;G10L15/22;G10L21/0208;G10L21/0216;G10L25/03 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 方法 裝置 用于 | ||
本發明實施例提供了一種模型訓練方法、裝置和用于模型訓練的裝置。所述方法包括:獲取語音訓練樣本,所述語音訓練樣本包括帶噪語音樣本以及所述帶噪語音樣本對應的干凈語音樣本;基于所述語音訓練樣本,對串聯的語音增強模型和語音識別模型進行迭代聯合訓練,在每輪訓練中根據所述語音增強模型和所述語音識別模型的聯合損失值調整所述語音增強模型,和/或,所述語音識別模型的模型參數,當所述聯合損失值滿足收斂條件得到訓練完成的語音增強模型和語音識別模型。本發明實施例能夠提升語音識別模型的訓練效率,并能夠在不降低干凈場景下語音識別模型的識別性能的情況下,提高語音識別模型在帶噪場景下的識別性能。
技術領域
本發明涉及智能控制技術領域,尤其涉及一種模型訓練方法、裝置和用于模型訓練的裝置。
背景技術
隨著語音識別算法技術的成熟,在干凈場景下的語音識別準確率得到了穩定的性能提升,但是在真實的帶噪場景下,語音數據往往沒有達到理想的干凈程度,這就會導致語音識別模型的識別準確率下降,并且隨著背景噪聲信噪比的減小,語音識別模型的語音識別性能會顯著下降。
目前的語音識別技術,主要是從數據層面或算法層面進行改進,以提高語音識別性能。具體的,數據層面主要是根據不同的需求場景,在訓練數據中加入匹配場景的訓練語料,然后基于調整后的訓練數據訓練語音識別模型。但是在真實場景中,訓練語料與場景的匹配度高低不定,難以獲取與場景高度匹配的訓練語料,且加入訓練語料后,訓練數據的數據量增大,導致語音識別模型的訓練時間也隨之增長,降低了語音識別模型的訓練效率。算法層面主要是通過神經網絡的學習對帶噪場景下的語音數據進行降噪處理,得到降噪后的干凈語音,然后基于降噪后的干凈語音進行語音識別。但是,基于降噪后的干凈語音進行語音識別,提高語音識別模型在真實場景下的語音識別性能的同時,會降低語音識別模型在干凈場景下的語音識別性能,導致語音識別模型的應用場景單一。
發明內容
本發明實施例提供一種模型訓練方法、裝置和用于模型訓練的裝置,可以提升復雜場景下語音識別模型的訓練效率,并提高語音識別模型的識別性能。
為了解決上述問題,本發明實施例公開了一種模型訓練方法,所述方法包括:
獲取語音訓練樣本,所述語音訓練樣本包括帶噪語音樣本以及所述帶噪語音樣本對應的干凈語音樣本;
基于所述語音訓練樣本,對串聯的語音增強模型和語音識別模型進行迭代聯合訓練,在每輪訓練中根據所述語音增強模型和所述語音識別模型的聯合損失值調整所述語音增強模型,和/或,所述語音識別模型的模型參數,當所述聯合損失值滿足收斂條件得到訓練完成的語音增強模型和語音識別模型。
可選地,所述基于所述語音訓練樣本,對串聯的語音增強模型和語音識別模型進行迭代聯合訓練,包括:
在每輪訓練中,在所述語音訓練樣本中選取帶噪語音樣本輸入所述語音增強模型進行語音增強處理,得到所述帶噪語音樣本對應的語音增強結果;
對所述語音增強結果進行特征提取,得到所述語音增強結果對應的目標特征數據;
將所述目標特征數據輸入所述語音識別模型進行語音識別處理,得到所述帶噪語音樣本的語音識別結果;
根據所述帶噪語音樣本的語音增強結果和所述帶噪語音樣本的語音識別結果,確定所述語音增強模型和所述語音識別模型的聯合損失值,并根據所述聯合損失值調整所述語音增強模型,和/或,所述語音識別模型的模型參數。
可選地,所述語音訓練樣本還包括所述帶噪語音樣本對應的文本信息,所述根據所述帶噪語音樣本的語音增強結果和所述帶噪語音樣本的語音識別結果,確定所述語音增強模型和所述語音識別模型的聯合損失值,包括:
根據所述帶噪語音樣本的語音增強結果和所述干凈語音樣本確定所述語音增強模型的第一損失值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110942719.7/2.html,轉載請聲明來源鉆瓜專利網。





