[發明專利]一種基于聲紋識別的智能鎖及其語音識別方法和系統在審
| 申請號: | 201710692968.9 | 申請日: | 2017-08-14 |
| 公開(公告)號: | CN107240397A | 公開(公告)日: | 2017-10-10 |
| 發明(設計)人: | 王煒婷;溫坤華;朱慧廣;陳俊 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/14;G07C9/00 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 羅滿 |
| 地址: | 510062 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聲紋 識別 智能 及其 語音 方法 系統 | ||
技術領域
本發明涉及信號處理技術領域,特別涉及一種基于聲紋識別的智能鎖的語音識別方法。本發明還涉及一種基于聲紋識別的智能鎖的語音識別系統。本發明還涉及一種包括上述語音識別系統的基于聲紋識別的智能鎖。
背景技術
隨著入室盜竊事件時常發生,如何升級家居門鎖,確保室內的安全,是人們不得不應對的新挑戰。
目前,市面上傳統的家居門鎖基本采用鑰匙解鎖、密碼解鎖,由于鑰匙易丟失、易復制、特征性不強等特點,同樣的,密碼解鎖存在易遺忘密碼,密碼易泄露的缺點,容易造成資源浪費的同時給用戶帶來安全隱患。另外,現有采用其他生物認證技術的智能化設備如指紋識別,虹膜識別等,成本高,具有接觸性的不便性、不衛生,例如指紋識別需要將手指放在傳感器上、虹膜識別需要將眼睛湊近攝像頭,不能提供很好的用戶體驗且給用戶造成經濟負擔。
在現有技術中,已經出現了基于聲紋識別的智能門鎖。聲紋鎖是基于聲音的模式識別,跟指紋鎖有異曲同工之用。只要主人說出事先設定的暗語就能把鎖打開,別人即使說出暗語也打不開,這種聲紋鎖辨別聲音的主要依據是音色。但是,由于大多數聲紋鎖對聲音的識別和驗證往往只采用GMM模型(Gaussian Mixture Model,高斯混合模型)方法訓練方法,實驗表明,只采用GMM說話人識別模型,在訓練和測試時的語音上下文內容對識別結果有很大的影響。當非目標說話人的識別語音上下文和目標說話人識別語音上下文較接近的時候,用該語音進行目標說話人測試時,錯誤接受的概率會大大的提高。
因此,如何提高聲紋鎖對目標說話人的識別率,降低錯誤接受概率,保證門鎖安全性能,是本領域技術人員亟待解決的技術問題。
發明內容
本發明的目的是提供一種基于聲紋識別的智能鎖的語音識別方法,能夠提高聲紋鎖對目標說話人的識別率,降低錯誤接受概率,保證門鎖安全性能。本發明的另一目的是提供一種基于聲紋識別的智能鎖的語音識別系統和一種包括上述語音識別系統的基于聲紋識別的智能鎖。
為解決上述技術問題,本發明提供一種基于聲紋識別的智能鎖的語音識別方法,包括:
提取待驗證語音信號對應的梅爾倒譜系數;
將所述梅爾倒譜系數作為輸入層輸入具有預設參數空間的區分深度置信網絡,以獲得所述區分深度置信網絡的隱層輸出,并將其作為所述梅爾倒譜系數的特征向量;
將所述特征向量與各個注冊語音信號預先構建的高斯混合模型進行對比,并計算所述特征向量分別與各個注冊語音信號相匹配的后驗概率;
判斷各所述后驗概率中的最大值是否大于預設閾值,如果是,則待驗證語音信號通過驗證,并對鎖具進行開鎖操作;反之則使鎖具保持鎖定狀態。
優選地,在提取待驗證語音信號對應的梅爾倒譜系數之前,還包括:
對智能鎖的注冊人進行注冊語音錄入,并對輸入的各個注冊語音信號構建高斯混合模型。
優選地,對輸入的各個注冊語音信號構建高斯混合模型,具體包括:
提取各個注冊語音信號對應的梅爾倒譜系數,并對輸入的各個所述注冊語音信號進行預設編號綁定;
將各個所述注冊語音信號對應的梅爾倒譜系數作為輸入層,同時將各個所述注冊語音信號綁定的編號作為輸出層,進行區分深度置信網絡訓練,并獲得所述區分深度置信網絡的參數空間;
將各個所述注冊語音信號對應的梅爾倒譜系數輸入所述區分深度置信網絡,以獲得所述區分深度置信網絡的隱層輸出,并將其作為各個所述注冊語音信號對應的梅爾倒譜系數的特征向量;
將各所述特征向量作為輸入,并以最大期望算法為準構建高斯混合模型。
優選地,提取待驗證語音信號或各個注冊語音信號對應的梅爾倒譜系數,具體包括:對待驗證語音信號或各個注冊語音信號依次進行預加重、加漢明窗、通過維納濾波法進行去噪、進行快速傅里葉變換、通過三角帶通濾波器進行濾波和離散余弦轉換。
優選地,在將各個所述注冊語音信號對應的梅爾倒譜系數輸入所述區分深度置信網絡,以獲得所述區分深度置信網絡的隱層輸出后,還包括:
通過公式:
校核所述區分深度置信網絡的隱層輸出質量,若D的值大于預設閾值,則隱層輸出質量滿足預設要求;
其中,D為區分度,Li為各注冊語音信號對應的特征向量的對應權值,Si為矩陣S中的元素,S=Sb-Sw,Sb為類內離散度矩陣,Sw為類間離散度矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710692968.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音合成方法
- 下一篇:智能語音交互方法及裝置





