[發明專利]音頻事件檢測模型訓練方法及裝置在審
| 申請號: | 202111005905.4 | 申請日: | 2021-08-30 |
| 公開(公告)號: | CN113724740A | 公開(公告)日: | 2021-11-30 |
| 發明(設計)人: | 張鵬遠;劉鈺卓;顏永紅 | 申請(專利權)人: | 中國科學院聲學研究所 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 事件 檢測 模型 訓練 方法 裝置 | ||
本發明涉及音頻檢測技術領域,提供了一種音頻事件檢測模型訓練方法及裝置,方法包括:對大師模型、教師模型、學生模型進行多次迭代,將滿足迭代結束條件的學生模型作為音頻事件檢測模型;其中,在每次迭代中,對大師和教師模型的輸出動態校正,為無標注數據生成偽標簽;利用音頻事件標簽、大師模型的輸出、老師模型的輸出,迭代教師模型;根據教師模型參數更新大師模型的參數;用音頻事件標簽和偽標簽迭代學生模型。本實施例的技術方案,通過大師模型和教師模型的模型參數的循環提升以及大師模型的輸出對教師模型的輸出的動態校正,可以提高無標注樣本的利用效率,提升偽標簽的正確率,從而提升音頻事件檢測的準確性。
技術領域
本發明涉及音頻檢測技術領域,尤其涉及音頻事件檢測模型訓練方法及裝置。
背景技術
音頻事件檢測是從一段連續音頻中檢測出是否有某種音頻事件發生。
目前,通過標注樣本進行教師模型訓練,使用訓練好的教師模型獲取無標注樣本的標簽,通過無標注樣本的標簽進行學生模型的訓練,使用訓練好的學生模型進行音頻事件檢測。
但是,標注樣本往往獲取困難且花費高昂,在標注樣本數量較少的情況下訓練好的模型的模型精度可能較低,從而導致音頻事件檢測的準確性較低。
發明內容
本實施例提供了一種音頻事件檢測模型訓練方法、裝置、計算機可讀存儲介質及電子設備,通過大師模型和教師模型的模型參數的循環提升以及大師模型的輸出對教師模型的輸出的動態校正,可以提高無標注樣本的利用效率,提升偽標簽的正確率,從而提升音頻事件檢測的準確性。
第一方面,本實施例提供了一種音頻事件檢測模型訓練方法,包括:
對于用于音頻事件檢測的多個訓練樣本中的每個訓練樣本,確定訓練樣本的三個訓練特征;其中,所述訓練樣本為無標注樣本或標注有音頻事件標簽的標注樣本;所述三個訓練特征均為所述訓練樣本的聲學特征;所述多個訓練樣本劃分為K個訓練樣本集,所述K個訓練樣本集各集均包括所述無標注樣本和所述標注樣本,所述K為大于等于1的正整數;
對大師模型、教師模型、學生模型進行多次迭代,基于滿足迭代結束條件的學生模型作為音頻事件檢測模型進行音頻事件檢測;其中,大師模型和教師模型的模型結構相同;多次迭代包括M個訓練周期,M個訓練周期各周期均包括分別與K個訓練樣本集一一對應的K次迭代,K次迭代中每次迭代對應的訓練樣本集中訓練樣本的三個訓練特征分別作為大師模型、教師模型、學生模型的輸入;多次迭代中的每次迭代包括:
根據大師模型基于上次迭代的模型參數對本次迭代輸入的無標注樣本的訓練特征進行計算輸出的音頻事件概率,對教師模型基于上次迭代的模型參數對本次迭代輸入的無標注樣本的訓練特征進行計算輸出的音頻事件概率進行修正,確定本次迭代對應的無標注樣本的偽標簽;
根據學生模型基于上次迭代的模型參數對本次迭代輸入的訓練特征進行計算輸出的音頻事件概率、本次迭代對應的標注樣本的音頻事件標簽、本次迭代對應的無標注樣本的偽標簽,調整學生模型上次迭代的模型參數,確定學生模型本次迭代的模型參數;
根據大師模型和教師模型各自基于上次迭代的模型參數對本次迭代輸入的訓練特征進行計算輸出的音頻事件概率、本次迭代對應的標注樣本的音頻事件標簽,調整教師模型上次迭代的模型參數,確定教師模型本次迭代的模型參數;
基于教師模型本次迭代和之前迭代的模型參數,確定大師模型本次迭代的模型參數。
第二方面,本實施例提供了一種音頻事件檢測模型訓練裝置,包括:
對于用于音頻事件檢測的多個訓練樣本中的每個訓練樣本,確定訓練樣本的三個訓練特征;其中,所述訓練樣本為無標注樣本或標注有音頻事件標簽的標注樣本;所述三個訓練特征均為所述訓練樣本的聲學特征;所述多個訓練樣本劃分為K個訓練樣本集,所述K個訓練樣本集各集均包括所述無標注樣本和所述標注樣本,所述K為大于等于1的正整數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所,未經中國科學院聲學研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111005905.4/2.html,轉載請聲明來源鉆瓜專利網。





