[發明專利]喚醒模型的訓練方法、裝置和計算機設備有效
| 申請號: | 202110059722.4 | 申請日: | 2021-01-18 |
| 公開(公告)號: | CN112365885B | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 徐泓洋;王廣新;楊漢丹 | 申請(專利權)人: | 深圳市友杰智新科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/08;G10L15/16;G10L15/26;G10L21/0264 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝;曹勇 |
| 地址: | 518000 廣東省深圳市南山區招商*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 喚醒 模型 訓練 方法 裝置 計算機 設備 | ||
1.一種喚醒模型的訓練方法,其特征在于,包括:
對訓練集中指定語音語句提取音頻幀,得到聲學特征矩陣,其中,所述指定語音語句屬于訓練集中的任意一語音訓練樣本;
將所述聲學特征矩陣輸入第一模型的關鍵詞檢出器,得到第一空間特征,將所述聲學特征矩陣輸入第二模型的編碼器中,得到第二空間特征,其中,所述第一模型為待訓練的喚醒模型,所述第二模型為訓練好的降噪模型;
計算所述第一空間特征和所述第二空間特征的空間特征的差異;
根據所述指定語音語句對應的空間特征的差異的計算方式,計算所述訓練集中所有語音語句分別對應的空間特征的差異;
根據所有語音語句分別對應的空間特征的差異以及所述喚醒模型預設的交叉熵損失,形成訓練所述喚醒模型的損失函數;
根據所述損失函數在所述訓練集上訓練所述喚醒模型。
2.根據權利要求1所述的喚醒模型的訓練方法,其特征在于,所述計算所述第一空間特征和所述第二空間特征的空間特征的差異的步驟,包括:
對比所述第一空間特征和所述第二空間特征,得到相似度矩陣;
將所述相似度矩陣,轉換為概率值;
根據轉化后的概率值計算KL散度損失;
將所述KL散度損失作為所述第一空間特征和所述第二空間特征的空間特征的差異。
3.根據權利要求2所述的喚醒模型的訓練方法,其特征在于,所述根據所有語音語句分別對應的空間特征的差異以及所述喚醒模型預設的交叉熵損失,形成訓練所述喚醒模型的損失函數的步驟,包括:
根據所述空間特征的差異,計算所述空間特征的差異對應的正則項;
將所述正則項作為第一損失函數;
獲取所述喚醒模型預設的交叉熵損失,作為第二損失函數;
對所述第一損失函數和所述第二損失函數求和,得到訓練所述喚醒模型的損失函數。
4.根據權利要求3所述的喚醒模型的訓練方法,其特征在于,所述根據所述損失函數在所述訓練集上訓練所述喚醒模型的步驟,包括:
固定所述降噪模型的編碼器參數;
將指定訓練數據并行輸入所述喚醒模型的關鍵詞檢出器,以及所述降噪模型的編碼器的參數;
獲取所述指定訓練數據通過所述喚醒模型的關鍵詞檢出器后的第一輸出數據,以及所述指定訓練數據通過所述降噪模型的編碼器后的第二輸出數據;
根據所述第一輸出數據和所述第二輸出數據,更新所述第一損失函數;
將所述第一輸出數據輸入連接于所述喚醒模型的關鍵詞檢出器輸出端的全連接層,得到第三輸出數據;
通過所述第三輸出數據更新所述第二損失函數;
判斷更新后的所述喚醒模型的損失函數的函數值是否變小;
若是,則反向傳播更新所述喚醒模型的關鍵詞檢出器的參數,直至在所述訓練集上所述喚醒模型的損失函數的函數值達到最小。
5.根據權利要求1所述的喚醒模型的訓練方法,其特征在于,所述對訓練集中指定語音語句提取音頻幀,得到聲學特征矩陣的步驟,包括:
獲取所述喚醒模型對應的批次計算指標;
根據所述批次計算指標確定所述批次處理數量;
按照所述批次處理數量,依次劃窗所述指定語音語句提取各音頻幀;
將各所述音頻幀按照在所述指定語音語句中的時序次序,得到依次排布的聲學特征矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市友杰智新科技有限公司,未經深圳市友杰智新科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110059722.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種直流智能充電樁
- 下一篇:基于自注意力的知識蒸餾方法、裝置和計算機設備





