[發明專利]語音識別用于特定目標喚醒的方法及裝置在審
| 申請號: | 201910124945.7 | 申請日: | 2019-02-19 |
| 公開(公告)號: | CN111583939A | 公開(公告)日: | 2020-08-25 |
| 發明(設計)人: | 李政;吳國揚;陳心章 | 申請(專利權)人: | 富港電子(東莞)有限公司;正崴精密工業股份有限公司 |
| 主分類號: | G10L17/24 | 分類號: | G10L17/24;G10L17/04;G10L17/02;G10L25/24 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 523455 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 用于 特定 目標 喚醒 方法 裝置 | ||
本發明公開一種語音識別用于特定目標喚醒的方法及裝置,其中方法包括如下步驟:接收特定目標的語音訊息,提取其中的語音特征;將特定目標的語音特征作為以鑒別式訓練的HVS模型的輸入數據并進行訓練,得到特定目標聲學模型,并儲存特定目標聲學模型;接收待測目標的語音訊息,提取其中的語音特征;將待測目標的語音特征作為以鑒別式訓練的潛藏向量狀態模型的輸入數據并進行訓練,得到待測目標的聲學模型;比對待測目標的聲學模型與特定目標的聲學模型,若兩者有關聯則將待測目標的語音特征使用語言模型進行語言解碼,并根據語言解碼結果判斷是否喚醒。本發明采用鑒別式訓練的HVS模型作為聲學模型,能夠精準且快速地判斷目標,進而達到喚醒的功用。
技術領域
本發明涉及一種語音識別領域,尤其涉及一種語音識別的方法及裝置。
背景技術
近年來,智慧音箱逐漸改變人們生活的方式,智慧音箱作為語音助理可協助用戶執行生活上的任務,例如幫忙叫車、購物、提醒事項、記錄資訊等等,盡管智慧音箱帶來生活上更多便利,然而智慧音箱仍有許多安全隱患,有時智慧音箱無法有效地判別使用者是否為初始設定的用戶而進行信用卡下訂商品的可能性,因此,為了防止有心人士使用,目前市面上許多智慧音箱會采用語音識別的方式作為防護措施。
一般的智慧音箱通常采用語音喚醒的方式喚醒智慧音箱進而執行后續任務,所謂語音喚醒的方式通常是從一段連續的語音中自動擷取一些使用者預先注冊的語音指令(喚醒詞)。傳統上使用隱藏式馬可夫模型(Hidden Markov Model,HMM)的技術,利用單獨的音素(Phoneme)、音節的特征向量比對,找出機率最大(最有可能)的單字,后來,又結合高斯混合模型(Gaussian Mixture Model,GMM)形成經典的GMM-HMM模型。現有的GMM-HMM模型常采用最大相似度訓練方法(Maximum Likelihood),然而此種方法在某些因素下容易使得競爭者答案機率大于正確答案機率,則導致正確率的下降,因此仍有進步改善的空間。
發明內容
本發明的目的是針對上述現有技術存在的缺陷和不足,提出一種語音識別用于特定目標喚醒的實現方法,利用特定目標的喚醒詞結合采用鑒別式訓練的潛藏向量狀態模型(Hidden Vector State Model,簡稱HVS Model),實現對特定目標的身分識別監測,從而達到特定目標語音喚醒的目的。
為實現上述目的,本發明實施例一方面提出了一種語音識別用于特定目標喚醒的方法,包括以下步驟:
S1:接收一特定目標的語音訊息并對所述特定目標的語音訊息進行預處理,提取所述特定目標的一語音特征;
S2:將所述特定目標的語音特征作為以鑒別式訓練的潛藏向量狀態模型(HVS Model)的輸入數據并進行訓練,得到一特定目標聲學模型,并儲存所述特定目標聲學模型;
S3:接收一待測目標的語音訊息并對所述待測目標的語音訊息進行預處理,提取所述待測目標的一語音特征;
S4:將所述待測目標的語音特征作為以鑒別式訓練的潛藏向量狀態模型的輸入數據并進行訓練,得到一待測目標的聲學模型;
S5:比對所述待測目標的聲學模型與所述特定目標的聲學模型之間的關聯性,若兩者有關聯則將所述待測目標的語音特征使用至少一語言模型進行語言解碼,并根據語言解碼結果判斷是否喚醒。
具體地,所述特定目標的語音訊息與所述待測目標的語音訊息中包括至少一喚醒詞。
具體地,所述預處理包括:將語音訊息進行雜訊抑制處理及回音消除處理。
具體地,所述語音特征利用梅爾倒頻譜系數(MFCC)的方式取得。
具體地,所述鑒別式訓練采用最大互信息法(MMI)進行訓練。
具體地,所述語言模型包括一詞庫模型或一文法模型或及其組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富港電子(東莞)有限公司;正崴精密工業股份有限公司,未經富港電子(東莞)有限公司;正崴精密工業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910124945.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理方法、裝置、設備及存儲介質
- 下一篇:汽車座椅調整裝置及汽車





