[發明專利]聲學模型處理方法、裝置、設備和可讀存儲介質在審
| 申請號: | 202110179892.6 | 申請日: | 2021-02-07 |
| 公開(公告)號: | CN112786028A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 唐浩雨 | 申請(專利權)人: | 百果園技術(新加坡)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/10;G10L15/16 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 新加坡巴西班讓路*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲學 模型 處理 方法 裝置 設備 可讀 存儲 介質 | ||
1.一種聲學模型處理方法,其特征在于,包括:
獲取多個樣本音頻數據和所述樣本音頻數據的樣本標簽;所述多個樣本音頻數據中包括多個不同音頻場景下的樣本音頻數據;
將所述樣本音頻數據分別輸入原始聲學模型和所屬音頻場景對應的專用聲學模型,得到對應的第一語音識別結果和第二語音識別結果;所述專用聲學模型為預先訓練得到的、用于識別對應音頻場景下的所述樣本音頻數據的聲學模型;
確定所述第二語音識別結果與所述第一語音識別結果之間的第一誤差數據,以及確定所述樣本音頻數據的樣本標簽與所述第一語音識別結果之間的第二誤差數據;
根據所述第一誤差數據和所述第二誤差數據對所述原始聲學模型進行訓練,得到用于識別所述音頻場景下的音頻數據的通用聲學模型。
2.根據權利要求1所述的方法,其特征在于,在所述將所述樣本音頻數據分別輸入原始聲學模型和所屬音頻場景對應的專用聲學模型之前,還包括:
通過所述多個樣本音頻數據對原始專用模型進行語音識別訓練,得到對應所述多個不同音頻場景的中間聲學模型;所述中間聲學模型用于識別所述多個不同音頻場景下的所述樣本音頻數據;
分別通過每個所述音頻場景下的所述樣本音頻數據對所述中間聲學模型進行調節訓練,得到每個所述音頻場景分別對應的所述專用聲學模型。
3.根據權利要求2所述的方法,其特征在于,在所述分別通過每個所述音頻場景下的所述樣本音頻數據對所述中間聲學模型進行調節訓練,得到每個所述音頻場景分別對應的所述專用聲學模型時,包括:
控制所述中間聲學模型的學習率的數值范圍,以保持所述專用聲學模型對不同所述音頻場景下的所述樣本音頻數據的識別能力。
4.根據權利要求3所述的方法,其特征在于,在所述控制所述中間聲學模型的學習率的數值范圍時,包括:
若所述音頻場景為預先設置的目標音頻場景,則控制所述中間聲學模型的學習率不低于預設學習率,以提高所述目標音頻場景對應的專用聲學模型對所述目標音頻場景下的樣本音頻數據的識別能力。
5.根據權利要求1所述的方法,其特征在于,在所述將所述樣本音頻數據分別輸入原始聲學模型和所屬音頻場景對應的專用聲學模型之前,還包括:
分別通過每個所述音頻場景下的所述樣本音頻數據對原始專用模型進行語音識別訓練,得到每個所述音頻場景分別對應的所述專用聲學模型。
6.根據權利要求1所述的方法,其特征在于,在所述將所述樣本音頻數據分別輸入原始聲學模型和所屬音頻場景對應的專用聲學模型之前,還包括:
通過所述樣本音頻數據對所述原始聲學模型進行預訓練,以提高所述原始聲學模型對所述樣本音頻數據的識別能力。
7.根據權利要求1-6中任一項所述的方法,其特征在于,在所述根據所述第一誤差數據和所述第二誤差數據對所述原始聲學模型進行訓練,得到用于識別所述音頻場景下的音頻數據的通用聲學模型時,包括:
控制所述第二誤差數據的作用大于所述第一誤差數據的作用。
8.一種聲學模型處理裝置,其特征在于,包括:
獲取模塊,用于獲取多個樣本音頻數據和所述樣本音頻數據的樣本標簽;所述多個樣本音頻數據中包括多個不同音頻場景下的樣本音頻數據;
輸入模塊,用于將所述樣本音頻數據分別輸入原始聲學模型和所屬音頻場景對應的專用聲學模型,得到對應的第一語音識別結果和第二語音識別結果;所述專用聲學模型為預先訓練得到的、用于識別對應音頻場景下的所述樣本音頻數據的聲學模型;
確定模塊,用于確定所述第二語音識別結果與所述第一語音識別結果之間的第一誤差數據,以及確定所述樣本音頻數據的樣本標簽與所述第一語音識別結果之間的第二誤差數據;
訓練模塊,用于根據所述第一誤差數據和所述第二誤差數據對所述原始聲學模型進行訓練,得到用于識別所述音頻場景下的音頻數據的通用聲學模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百果園技術(新加坡)有限公司,未經百果園技術(新加坡)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110179892.6/1.html,轉載請聲明來源鉆瓜專利網。





