[發明專利]一種語音和唇語相融合的身份認證方法在審
| 申請號: | 201910603999.1 | 申請日: | 2019-07-05 |
| 公開(公告)號: | CN110364163A | 公開(公告)日: | 2019-10-22 |
| 發明(設計)人: | 張新曼;申沅均;陳奕宇;公維勇;王寅;尚東鵬;許學斌 | 申請(專利權)人: | 西安交通大學;廣東順德西安交通大學研究院 |
| 主分類號: | G10L15/25 | 分類號: | G10L15/25;G10L25/24;G10L15/06;G10L25/45;G10L25/51;G10L17/00 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 安彥彥 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 身份認證 語音 融合 認證成功 向量特征 倒頻譜 身份認證系統 極限學習機 并行策略 認證領域 認證失敗 生物特征 輸出結果 信息安全 訓練樣本 多輸出 強健性 提示符 多模 復數 向量 輸出 認證 | ||
1.一種語音和唇語相融合的身份認證方法,其特征在于,包括以下步驟:
1)提取待認證的語音倒頻譜特征和唇語特征;
2)采用并行策略融合所述語音倒頻譜特征和所述唇語特征,得到復向量特征;
3)利用復向量特征作為訓練樣本訓練復數極限學習機的多輸入多輸出模型,根據輸出的分布及其取值判斷是否認證成功;
若輸出結果向量中的最大值與設定提示符一致且最大值大于設定閾值,則認證成功;否則,認證失敗。
2.根據權利要求1所述的語音和唇語相融合的身份認證方法,其特征在于,步驟1)中語音倒頻譜特征的提取方法具體過程為:
利用雙門限法對語音信號進行分段,并采用梅爾濾波器提取語音倒頻譜特征。
3.根據權利要求2所述的語音和唇語相融合的身份認證方法,其特征在于,利用雙門限法對語音信號進行分段的具體過程為:
用交疊分段的方法對語音信號進行分幀,得到短時序列;
用窗函數乘以短時序列,形成短時加窗語音信號;
利用短時加窗語音信號的短時能量和短時過零率截出語音段的起止點,起止點之間的語音即為有效語音段。
4.根據權利要求3所述的語音和唇語相融合的身份認證方法,其特征在于,利用短時加窗語音信號的短時能量和短時過零率截出有效語音段的起止點的具體過程包括以下步驟:
1)計算每幀音頻的短時能量和短時過零率,計算公式如下所示,短時能量為
短時過零率為
其中,xn(m)代表第n幀的第m個序列值,sgn[]代表符號函數;
2)根據語音能量的輪廓選取一個高門限T2,進行粗判斷;語音起止點位于T2與短時能量包絡交點N3和N4所對應的時間間隔之外,N3作為初判起點,N4作為初判終點;
3)根據背景噪聲的能量選取一個低門限T1,從初判起點N3往左,從初判終點N4往右搜索,分別找到第一次與低門限T1相交的兩個點N2和N5,于是N2至N5段就是由短時能量確定的語音段;
4)以短時平均過零率為基準,從N2點往左和N5點往右搜索,找到短時平均過零率低于閾值T3的兩點N1和N6,即為語音段的起止點。
5.根據權利要求3所述的語音和唇語相融合的身份認證方法,其特征在于,采用梅爾濾波器提取語音倒頻譜特征的具體過程為:
1)對每幀短時序列進行快速傅里葉變換,計算公式如下:
計算FFT后每幀序列的譜線能量,計算公式如下:
En(k)=[Xn(k)]2 (4);
2)采用Mel復頻率將語音頻率劃分為若干個三角形的帶通濾波器序列,得到Mel濾波器組:
語音頻率劃分成一系列三角形的帶通濾波器序列,其傳遞函數如下:
其中,f(m)為三角形的帶通濾波器序列,0≤m<M,M為濾波器組數,fl和fh分別是濾波器組的最高和最低頻率,fs為采樣頻率,N為FFT變換的序列點數,
3)通過Mel濾波器組,計算頻域中每幀的能量譜:
4)通過離散余弦變換將每幀的能量譜從頻域重新變換到時域,得到復倒譜系數:
其中,i為MFCC的系統階數,取值范圍為12~16;MFCC為一個矩陣,幀數×階數,每幀的特征為一個向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學;廣東順德西安交通大學研究院,未經西安交通大學;廣東順德西安交通大學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910603999.1/1.html,轉載請聲明來源鉆瓜專利網。





