[發明專利]面向家居CNN分類與特征匹配聯合的聲紋識別方法在審
| 申請號: | 202010439102.9 | 申請日: | 2020-05-22 |
| 公開(公告)號: | CN111785286A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 張暉;張金鑫;趙海濤;孫雁飛;倪藝洋;朱洪波 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G10L17/18 | 分類號: | G10L17/18;G10L25/24;G10L25/03;G06K9/62 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 向文 |
| 地址: | 210012 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 家居 cnn 分類 特征 匹配 聯合 聲紋 識別 方法 | ||
本發明公開了一種面向家居CNN分類與特征匹配聯合的聲紋識別方法,包括如下步驟:對語音進行短時傅里葉變換生成語譜圖;將語譜圖輸入到訓練好的卷積神經網絡進行分類,若識別為非家庭成員,流程結束;對語音信號提取MFCC特征參數;將MFCC特征參數和k?means特征模板進行匹配,獲取最終識別結果。本發明基于語譜圖的生成、卷積神經網絡、k?means算法、余弦相似度測量方法,在保證識別準確率的情況下,有效的降低了語音識別的誤檢率和漏檢率,解決了誤檢率和漏檢率較高的問題,保證了家居環境的絕對安全。
技術領域
本發明屬于聲紋識別領域,具體涉及一種面向家居CNN分類與特征匹配聯合的聲紋識別方法。
背景技術
聲紋識別也稱為說話人識別,包括說話人辨認和說話人確認。聲紋識別應用領域十分廣泛,包括金融領域、軍事安全、醫療領域以及家居安全領域等等。在許多聲紋識別系統的識別之前,除了預處理操作外,特征參數和模型匹配對識別的準確率至關重要。現有的聲紋識別算法無法達到百分之百的識別準確率,誤檢率和漏檢率較高,無法保證家居環境下的人身和財產的絕對安全。
發明內容
發明目的:為了克服現有技術中存在的不足,提供一種面向家居CNN分類與特征匹配聯合的聲紋識別方法,在保證識別準確率的前提下,降低誤檢率和漏檢率。該方法對現有模型進行改進,從而解決誤檢率和漏檢率較高的問題。
技術方案:為實現上述目的,本發明提供一種面向家居CNN分類與特征匹配聯合的聲紋識別方法,包括如下步驟:
S1:對語音進行短時傅里葉變換生成語譜圖;
S2:將語譜圖輸入到訓練好的卷積神經網絡進行分類,若識別為非家庭成員,流程結束,否則,轉至步驟S3;
S3:對語音信號提取MFCC特征參數;
S4:將MFCC特征參數和k-means特征模板進行匹配,獲取最終識別結果。
進一步的,所述步驟S1中語音在進行短時傅里葉變換之前經過預處理操作。
進一步的,所述步驟S1中預處理操作包括采樣量化、預加重、加窗和分幀、端點檢測。
進一步的,所述步驟S2中卷積神經網絡包括輸入層、卷積層、池化層、全連接層和輸出層,池化層采用平均池化,輸出層采用softmax函數,采用BP算法對卷積神經網絡進行訓練。
進一步的,所述步驟S3中通過Mel濾波器的階數調整提取MFCC特征參數。
進一步的,所述步驟S3中MFCC特征參數的提取過程為:
A)對輸入的語音信號進行預處理,生成時域信號,對每一幀語音信號通過快速傅里葉變換或離散傅里葉變換處理得到語音線性頻譜;
B)將線性頻譜輸入Mel濾波器組進行濾波,生成Mel頻譜,取Mel頻譜的對數能量,生成相應的對數頻譜;
C)使用離散余弦變換將對數頻譜轉換為MFCC特征參數。
進一步的,所述步驟S4中k-means特征模板的生成過程為:隨機選擇聚類中心;遍歷數據集中所有樣本,計算訓練數據集分別到各個聚類中心的距離,記錄距離最近的中心點,然后把這個點分配到這個聚類內;接著遍歷所有的聚類中心,移動聚類中心的新位置到所有屬于這個聚類的均值處;重復上面步驟,不斷更新聚類中心位置直到不再移動。
進一步的,所述步驟S4中采用余弦相似度方法進行匹配,通過計算兩個矢量之間夾角的余弦值來評估相似度。
進一步的,所述步驟S1中語譜圖的生成過程為:
a)對語音信號進行分幀處理,得到x(m,n),其中m表示幀的個數,n表示幀長,再通過短時傅里葉變換,轉為X(m,n);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010439102.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種視訊AI實現方法及系統
- 下一篇:面向家居多特征參數融合的聲紋識別方法





