[發明專利]音頻識別模型訓練方法,音色相似度檢測方法在審
| 申請號: | 202110809025.6 | 申請日: | 2021-07-16 |
| 公開(公告)號: | CN113470629A | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 譚志力;胡詩超 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/10;G10L15/16;G10L25/51 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 陳彥如 |
| 地址: | 518052 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 識別 模型 訓練 方法 音色 相似 檢測 | ||
1.一種音頻識別模型訓練方法,其特征在于,包括:
從訓練樣本庫中獲取第一無噪音頻和第二無噪音頻;
對所述第一無噪音頻和所述第二無噪音頻分別添加隨機噪聲,得到所述第一無噪音頻對應的第一有噪音頻,以及所述第二無噪音頻對應的第二有噪音頻;
將所述第一無噪音頻、所述第二無噪音頻、所述第一有噪音頻和所述第二有噪音頻分別輸入音色提取模型,分別提取第一無噪音色特征、第二無噪音色特征、第一有噪音色特征以及第二有噪音色特征;
基于所述第一有噪音色特征以及所述第二有噪音色特征計算所述第一有噪音頻和所述第二有噪音頻的有噪相似度,以及基于所述第一無噪音色特征、所述第二無噪音頻特征、所述第一有噪音色特征以及所述第二有噪音色特征計算所述第一無噪音頻和所述第二無噪音頻的相似度偏移真實值;
將所述第一有噪音色特征、所述第二有噪音色特征和所述有噪相似度輸入待訓練的神經網絡模型,以使所述神經網絡模型輸出所述第一有噪音頻和所述第二有噪音頻的相似度偏移預測值;
計算所述相似度偏移預測值與所述相似度偏移真實值之間的損失值,并將該損失值添加至目標損失集;
基于所述目標損失集中每一損失值調節所述神經網絡模型的模型參數;
從所述訓練樣本庫中重新獲取兩個無噪音頻,以對更新后的神經網絡模型進行迭代訓練,直至達到模型收斂條件,輸出音頻識別模型。
2.根據權利要求1所述的方法,其特征在于,還包括:
獲取所述第一無噪音頻和所述第二無噪音頻的無噪相似度真實值;
利用所述神經網絡模型確定所述第一有噪音頻和所述第二有噪音頻的無噪相似度預測值;
計算所述無噪相似度預測值與所述無噪相似度真實值之間的損失值,并將該損失值添加至所述目標損失集。
3.根據權利要求1所述的方法,其特征在于,還包括:
獲取所述第一無噪音頻和所述第二無噪音頻屬于同一音色的概率真實值;
利用所述神經網絡模型確定所述第一有噪音頻和所述第二有噪音頻屬于同一音色的概率預測值;
計算所述概率預測值與所述概率真實值之間的損失值,并將該損失值添加至所述目標損失集。
4.根據權利要求1至3任一項所述的方法,其特征在于,還包括:
獲取所述第一有噪音頻的第一真實信噪比;
利用所述神經網絡模型確定所述第一有噪音頻的第一預測信噪比;
計算所述第一預測信噪比與所述第一真實信噪比之間的損失值,并將該損失值添加至所述目標損失集;
和/或
獲取所述第二有噪音頻的第二真實信噪比;
利用所述神經網絡模型確定所述第二有噪音頻的第二預測信噪比;
計算所述第二預測信噪比與所述第二真實信噪比之間的損失值,并將該損失值添加至所述目標損失集;
和/或
獲取所述第一有噪音頻的第一真實長度;
利用所述神經網絡模型確定所述第一有噪音頻的第一預測長度;
計算所述第一預測長度與所述第一真實長度之間的損失值,并將該損失值添加至所述目標損失集;
和/或
獲取所述第二有噪音頻的第二真實長度;
利用所述神經網絡模型確定所述第二有噪音頻的第二預測長度;
計算所述第二預測長度與所述第二真實長度之間的損失值,并將該損失值添加至所述目標損失集。
5.一種音色相似度檢測方法,其特征在于,包括:
獲取第一音頻和第二音頻;
將所述第一音頻和所述第二音頻分別輸入音色提取模型,以使所述音色提取模型輸出所述第一音頻對應的第一音色特征,以及所述第二音頻對應的第二音色特征;
計算所述第一音色特征和所述第二音色特征的待糾正相似度;
將所述第一音色特征、所述第二音色特征和所述待糾正相似度輸入音頻識別模型,以使所述音頻識別模型輸出相似度檢測結果;所述音頻識別模型利用權利要求1至4任一項所述的方法訓練獲得;
基于所述相似度檢測結果確定所述第一音頻和所述第二音頻的音色相似度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110809025.6/1.html,轉載請聲明來源鉆瓜專利網。





