[發明專利]語速檢測模型的訓練方法及裝置、語速檢測方法及裝置在審
| 申請號: | 202011568346.3 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112786017A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 王卓然;高強;劉魯鵬;夏龍;元海明;王宏偉;郭常圳 | 申請(專利權)人: | 北京猿力未來科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/14;G10L25/24 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 劉曉楠 |
| 地址: | 100102 北京市朝陽區廣順南大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語速 檢測 模型 訓練 方法 裝置 | ||
1.一種語速檢測模型的訓練方法,其特征在于,所述方法包括:
獲取樣本音頻片段的訓練數據組集合,其中,所述樣本音頻片段包括多個樣本子音頻片段,每個訓練數據組包括所述樣本子音頻片段的頻譜圖和樣本標簽,每個樣本標簽為所述樣本音頻片段的開始時間點到每個樣本子音頻片段的結束時間點之間包括的詞單元的長度信息;
將所述訓練數據組集合輸入語速檢測模型的時間卷積模塊中,確定每個樣本子音頻片段i的第一向量,其中,每個樣本子音頻片段i的第一向量根據樣本子音頻片段i及前i-1個樣本子音頻片段共同確定,i為大于或等于1的正整數;
將每個樣本子音頻片段i的第一向量輸入注意力層,確定每個樣本子音頻片段i的第二向量,其中,每個樣本子音頻片段i的第二向量根據樣本子音頻片段i及至少前1個樣本子音頻片段共同確定;
將每個樣本子音頻片段i的第二向量輸入全連接層,確定每個樣本子音頻片段i的預測標簽;
基于每個樣本子音頻片段i的預測標簽和每個樣本子音頻片段i的樣本標簽對所述語速檢測模型進行訓練,直至達到訓練停止條件。
2.如權利要求1所述的語速檢測模型的訓練方法,其特征在于,所述將每個樣本子音頻片段i的第一向量輸入注意力層,確定每個樣本子音頻片段i的第二向量,包括:
基于目標矩陣和每個樣本子音頻片段i的第一向量,確定每個樣本子音頻片段i的第一權重;
基于每個第一權重確定每個樣本子音頻片段i相對于所述至少前1個樣本子音頻片段的第二權重;
基于每個樣本子音頻片段i的第二權重和所述至少前1個樣本子音頻片段的第一向量,確定每個樣本子音頻片段的第二向量。
3.如權利要求1所述的語速檢測模型的訓練方法,其特征在于,所述將每個樣本子音頻片段i的第二向量輸入全連接層,確定每個樣本子音頻片段i的預測標簽,包括:
基于目標樣本子音頻片段i的第二向量確定所述目標樣本子音頻片段i的第三向量,其中,所述目標樣本子音頻片段i為所述多個樣本子音頻片段i中的任意一個;
基于所述第三向量,通過歸一化函數分別確定每種參考標簽為所述目標樣本子音頻片段i的預測標簽的概率;
將最大概率對應的參考標簽確定為所述目標樣本子音頻片段i的預測標簽。
4.如權利要求1所述的語速檢測模型的訓練方法,其特征在于,所述基于每個樣本子音頻片段i的預測標簽和每個樣本子音頻片段i的樣本標簽對所述語速檢測模型進行訓練,直至達到訓練停止條件,包括:
基于每個樣本子音頻片段i的預測標簽和每個樣本子音頻片段i的樣本標簽,通過損失函數,確定每個樣本子音頻片段i對應的損失值;
基于每個樣本子音頻片段i對應的損失值確定所述樣本音頻片段對應的損失值;
基于所述樣本音頻片段對應的損失值,對所述語速檢測模型進行訓練,直至達到訓練停止條件。
5.如權利要求1所述的語速檢測模型的訓練方法,其特征在于,所述獲取樣本音頻片段的訓練數據組集合,包括:
確定所述樣本音頻片段包括的每個樣本子音頻片段的樣本標簽;
對每個樣本子音頻片段進行處理,確定每個樣本子音頻片段的頻譜圖;
將同一個樣本子音頻片段的標簽和頻譜圖確定為一個訓練數據組,得到所述訓練數據組集合。
6.如權利要求5所述的語速檢測模型的訓練方法,其特征在于,所述對每個樣本子音頻片段進行處理,確定每個樣本子音頻片段的頻譜圖,包括:
將目標樣本子音頻片段進行分幀,得到多幀樣本子音頻片段,其中,所述目標樣本子音頻片段為所述多個樣本子音頻片段中的任意一個;
對每幀樣本子音頻片段進行傅里葉變換,得到每幀樣本子音頻片段的頻譜特征;
將所述多幀樣本子音頻片段的頻譜特征進行拼接,得到所述目標樣本子音頻片段的頻譜圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京猿力未來科技有限公司,未經北京猿力未來科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011568346.3/1.html,轉載請聲明來源鉆瓜專利網。





