[發明專利]一種基于聲紋識別的智能鎖及其語音識別方法和系統在審
| 申請號: | 201710692968.9 | 申請日: | 2017-08-14 |
| 公開(公告)號: | CN107240397A | 公開(公告)日: | 2017-10-10 |
| 發明(設計)人: | 王煒婷;溫坤華;朱慧廣;陳俊 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/14;G07C9/00 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 羅滿 |
| 地址: | 510062 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聲紋 識別 智能 及其 語音 方法 系統 | ||
1.一種基于聲紋識別的智能鎖的語音識別方法,其特征在于,包括:
提取待驗證語音信號對應的梅爾倒譜系數;
將所述梅爾倒譜系數作為輸入層輸入具有預設參數空間的區分深度置信網絡,以獲得所述區分深度置信網絡的隱層輸出,并將其作為所述梅爾倒譜系數的特征向量;
將所述特征向量與各個注冊語音信號預先構建的高斯混合模型進行對比,并計算所述特征向量分別與各個注冊語音信號相匹配的后驗概率;
判斷各所述后驗概率中的最大值是否大于預設閾值,如果是,則待驗證語音信號通過驗證,并對鎖具進行開鎖操作;反之則使鎖具保持鎖定狀態。
2.根據權利要求1所述的語音識別方法,其特征在于,在提取待驗證語音信號對應的梅爾倒譜系數之前,還包括:
對智能鎖的注冊人進行注冊語音錄入,并對輸入的各個注冊語音信號構建高斯混合模型。
3.根據權利要求2所述的語音識別方法,其特征在于,對輸入的各個注冊語音信號構建高斯混合模型,具體包括:
提取各個注冊語音信號對應的梅爾倒譜系數,并對輸入的各個所述注冊語音信號進行預設編號綁定;
將各個所述注冊語音信號對應的梅爾倒譜系數作為輸入層,同時將各個所述注冊語音信號綁定的編號作為輸出層,進行區分深度置信網絡訓練,并獲得所述區分深度置信網絡的參數空間;
將各個所述注冊語音信號對應的梅爾倒譜系數輸入所述區分深度置信網絡,以獲得所述區分深度置信網絡的隱層輸出,并將其作為各個所述注冊語音信號對應的梅爾倒譜系數的特征向量;
將各所述特征向量作為輸入,并以最大期望算法為準構建高斯混合模型。
4.根據權利要求3所述的語音識別方法,其特征在于,提取待驗證語音信號或各個注冊語音信號對應的梅爾倒譜系數,具體包括:對待驗證語音信號或各個注冊語音信號依次進行預加重、加漢明窗、通過維納濾波法進行去噪、進行快速傅里葉變換、通過三角帶通濾波器進行濾波和離散余弦轉換。
5.根據權利要求4所述的語音識別方法,其特征在于,在將各個所述注冊語音信號對應的梅爾倒譜系數輸入所述區分深度置信網絡,以獲得所述區分深度置信網絡的隱層輸出后,還包括:
通過公式:
校核所述區分深度置信網絡的隱層輸出質量,若D的值大于預設閾值,則隱層輸出質量滿足預設要求;
其中,D為區分度,Li為各注冊語音信號對應的特征向量的對應權值,Si為矩陣S中的元素,S=Sb-Sw,Sb為類內離散度矩陣,Sw為類間離散度矩陣。
6.根據權利要求5所述的語音識別方法,其特征在于,在提取待驗證語音信號對應的梅爾倒譜系數之前,對智能鎖的注冊人進行注冊語音錄入之后,還包括:
采集若干個未訓練的語音信號;
若當前未訓練的語音信號的數量小于預設閾值,則將各未訓練的語音信號所對應的梅爾倒譜系數輸入所述區分深度置信網絡,以修正其參數空間;
若當前未訓練的語音信號的數量超過預設閾值,則將各未訓練的語音信號所對應的梅爾倒譜系數輸入已修正后的區分深度置信網絡,以獲取對應的修正特征向量,并利用所述修正特征向量對所述高斯混合模型進行修正。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710692968.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音合成方法
- 下一篇:智能語音交互方法及裝置





