[發明專利]一種人工智能語音喚醒方法在審
| 申請號: | 202011075074.3 | 申請日: | 2020-10-09 |
| 公開(公告)號: | CN112233656A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 程松林 | 申請(專利權)人: | 安徽訊呼信息科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L21/0208 |
| 代理公司: | 合肥律眾知識產權代理有限公司 34147 | 代理人: | 魏潔 |
| 地址: | 230000 安徽省合肥市高新區習友路3*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 人工智能 語音 喚醒 方法 | ||
1.一種人工智能語音喚醒方法,其特征在于:包括以下步驟:
S1、獲取語音數據;
S2、利用語音檢測模型確定語音數據對應的能量特征,根據能量特征確定語音數據對應的文本數據;
S3、判斷語音數據中是否包含喚醒關鍵詞;
S4、若語音數據中包含喚醒關鍵詞,利用喚醒判決模型進行喚醒判定,否則喚醒判決模型輸出維持現狀指令。
2.根據權利要求1所述的人工智能語音喚醒方法,其特征在于:所述利用語音檢測模型確定語音數據對應的能量特征,包括:
對語音數據進行預處理,確定語音數據中各濾波器組能量值;
利用訓練后的語音檢測模型,對語音數據中各濾波器組能量值進行處理。
3.根據權利要求2所述的人工智能語音喚醒方法,其特征在于:所述利用訓練后的語音檢測模型,對語音數據中各濾波器組能量值進行處理,包括:
確定某一幀語音數據中各濾波器組能量值,以及對應平滑參數;
獲取前一幀語音數據中各平滑后的濾波器組能量值;
根據濾波器組能量值、平滑后的濾波器組能量值和平滑參數,確定某一幀語音數據中對應的平滑后的濾波器組能量值。
4.根據權利要求1-3中任意一項所述的人工智能語音喚醒方法,其特征在于:所述語音檢測模型的訓練步驟包括:
獲取訓練語音數據,并對語音檢測模型進行初始化;
利用訓練語音數據對語音檢測模型進行訓練,確定訓練后的語音檢測模型以及對應平滑參數。
5.根據權利要求1所述的人工智能語音喚醒方法,其特征在于:所述判斷語音數據中是否包含喚醒關鍵詞,包括:
對連續多幀的語音數據進行特征分析,并對音頻特征進行緩存;
利用關鍵詞對比模型將每一幀緩存音頻特征與喚醒關鍵詞進行對比,確定該幀音頻特征與喚醒關鍵詞之間的關聯度;
根據各音頻特征與喚醒關鍵詞之間的關聯度,確定語音數據包含喚醒關鍵詞的置信度。
6.根據權利要求5所述的人工智能語音喚醒方法,其特征在于:先對所述關鍵詞對比模型進行訓練,再訓練所述喚醒判決模型。
7.根據權利要求6所述的人工智能語音喚醒方法,其特征在于:所述關鍵詞對比模型利用第一語音數據訓練樣本集進行訓練,所述第一語音數據訓練樣本集包含喚醒關鍵詞。
8.根據權利要求7所述的人工智能語音喚醒方法,其特征在于:所述喚醒判決模型利用第二語音數據訓練樣本集、喚醒關鍵詞文本數據進行訓練,所述第二語音數據訓練樣本集中的背景噪音大于第一語音數據訓練樣本集中的背景噪音。
9.根據權利要求8所述的人工智能語音喚醒方法,其特征在于:所述利用喚醒判決模型進行喚醒判定,包括:
將關鍵詞對比模型檢測出的喚醒關鍵詞與S2中的文本數據一同輸入訓練好的喚醒判決模型,喚醒判決模型根據關鍵詞對比模型的檢測結果與文本數據綜合進行喚醒判定。
10.根據權利要求9所述的人工智能語音喚醒方法,其特征在于:若所述喚醒判決模型判定關鍵詞對比模型的檢測結果、文本數據中均包含喚醒關鍵詞,則所述喚醒判決模型輸出喚醒指令;否則,所述喚醒判決模型輸出維持現狀指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽訊呼信息科技有限公司,未經安徽訊呼信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011075074.3/1.html,轉載請聲明來源鉆瓜專利網。





