[發明專利]聲紋喚醒方法、裝置、計算機設備以及存儲介質有效
| 申請號: | 201910865434.0 | 申請日: | 2019-09-12 |
| 公開(公告)號: | CN110570873B | 公開(公告)日: | 2022-08-05 |
| 發明(設計)人: | 劉文龍 | 申請(專利權)人: | OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司 |
| 主分類號: | G10L17/22 | 分類號: | G10L17/22;G10L17/04;G10L17/02 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 邢少真 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲紋 喚醒 方法 裝置 計算機 設備 以及 存儲 介質 | ||
1.一種聲紋喚醒方法,其特征在于,所述方法由終端執行,所述方法包括:
獲取用戶輸入的喚醒語音;
獲取所述喚醒語音的聲音強度;
當所述喚醒語音的聲音強度高于預設閾值時,通過第一語音匹配模型和第二語音匹配模型分別對所述喚醒語音進行語音匹配;所述第一語音匹配模型和所述第二語音匹配模型分別是通過第二訓練數據訓練獲得的模型,所述第二訓練數據包括正樣本語音和負樣本語音,所述正樣本語音是包含指定文本的語音,所述負樣本語音是不包含指定文本的語音;所述指定文本是所述第一語音匹配模型或者所述第二語音匹配模型訓練時,采用的喚醒詞對應的文本內容中包含的文本;
當通過所述第一語音匹配模型和所述第二語音匹配模型分別匹配出所述喚醒語音中包含所述指定文本時,通過聲紋特征提取模型對所述喚醒語音進行處理,獲取第一聲紋特征;所述聲紋特征提取模型是根據第一訓練數據訓練獲得的模型,所述第一訓練數據包括不同用戶閱讀不同的文本內容時產生的訓練語音;
將所述第一聲紋特征與所述終端中預先存儲的至少一個聲紋特征模板進行匹配;所述聲紋特征模板中包含至少兩個聲紋特征,所述聲紋特征模板中的聲紋特征分別對應于不同的用戶;
當所述第一聲紋特征與所述至少一個聲紋特征模板中的任意一個聲紋特征匹配時,喚醒所述終端。
2.根據權利要求1所述的方法,其特征在于,所述第一訓練數據中的每一條所述訓練語音是N個用戶中的一個用戶閱讀M條文本內容中的一條文本內容時產生的語音;M、N分別是大于或者等于2的整數;
所述獲取用戶輸入的喚醒語音之前,還包括:
通過所述第一訓練數據中包含的各條所述訓練語音對識別模型進行訓練,所述識別模型包含提取模型以及分類模型,所述提取模型用于提取輸入的語音的聲紋特征,所述分類模型用于對所述提取模型輸出的聲紋特征進行分類確定對應的用戶和文本內容;
當所述識別模型訓練至收斂時,將所述提取模型獲取為所述聲紋特征提取模型。
3.根據權利要求1所述的方法,其特征在于,所述聲紋特征提取模型依次包括語音特征提取層、至少一層巻積層、基于注意力機制的門控循環單元GRU網絡層以及至少一層全連接層;
所述通過聲紋特征提取模型對所述喚醒語音進行處理,獲取第一聲紋特征,包括:
通過所述語音特征提取層提取所述喚醒語音的梅爾頻率倒譜系數MFCC特征,并分別通過所述至少一層巻積層、基于注意力機制的門控循環單元GRU網絡層以及至少一層全連接層,依次對上層處理結果進行處理,獲得所述第一聲紋特征。
4.根據權利要求1所述的方法,其特征在于,所述將所述第一聲紋特征與聲紋特征模板進行匹配之前,還包括:
檢測是否存儲有所述聲紋特征模板;
當未存儲有所述聲紋特征模板時,展示提示信息,所述提示信息用于指示進行模板語音的錄入;
接收錄入的至少一條模板語音;
通過所述聲紋特征提取模型分別對所述至少一條模板語音進行處理,獲取所述至少一條模板語音各自的第二聲紋特征;
根據所述至少一條模板語音各自的第二聲紋特征生成所述聲紋特征模板。
5.根據權利要求1所述的方法,其特征在于,所述第一語音匹配模型的復雜程度低于所述第二語音匹配模型的復雜程度;
所述通過第一語音匹配模型和第二語音匹配模型分別對喚醒語音進行語音匹配,包括:
通過所述第一語音匹配模型對所述喚醒語音進行匹配,獲取第一匹配結果;
當所述第一匹配結果指示所述喚醒語音中包含所述指定文本時,通過所述第二語音匹配模型對所述喚醒語音進行匹配,獲得第二匹配結果;
所述當通過所述第一語音匹配模型和所述第二語音匹配模型分別匹配出所述喚醒語音中包含所述指定文本時,執行所述通過聲紋特征提取模型對所述喚醒語音進行處理,獲取第一聲紋特征的步驟,包括:
當所述第二匹配結果指示所述喚醒語音中包含所述指定文本時,執行所述通過聲紋特征提取模型對所述喚醒語音進行處理,獲取第一聲紋特征的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司,未經OPPO廣東移動通信有限公司;上海瑾盛通信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910865434.0/1.html,轉載請聲明來源鉆瓜專利網。





