[發明專利]一種噪聲環境下聲紋識別的語音特征處理方法有效

申請號：	201610125032.3	申請日：	2016-03-04
公開（公告）號：	CN105679312B	公開（公告）日：	2019-09-10
發明（設計）人：	張毅;謝延義;徐曉東;蕭紅;羅久飛;黃超;王可佳;倪雷	申請（專利權）人：	重慶郵電大學
主分類號：	G10L15/02	分類號：	G10L15/02;G10L19/02;G10L21/0332
代理公司：	重慶市恒信知識產權代理有限公司 50102	代理人：	劉小紅
地址：	400065 ***	國省代碼：	重慶;50
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種噪聲環境聲紋識別語音特征處理方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種噪聲環境下聲紋識別的語音特征處理方法，其特征在于，該方法包括以下幾個步驟：

步驟1：獲取噪聲環境下的語音信號，根據語音的特點對信號進行前期處理，包括預加重處理，加窗處理和端點檢測；

步驟2：估算發聲個體的基音周期，并以此為依據對語音信號進行譜平滑處理，得到新的譜包絡，計算通過梅爾濾波器的能量，最終通過DCT倒譜計算得到SFCC；

步驟3：結合均值消減法、方差歸一化、時間序列濾波法和加權自回歸移動平均濾波法依次對步驟2得到的SFCC進行后處理，得到最終語音特征MVDA。

2.根據權利要求1所示的噪聲環境下聲紋識別的語音特征處理方法，其特征在于，步驟 1對信號進行前期處理，具體為：步驟A1：根據口腔的輻射響應接近于一階高通函數的特性，采用的預加重濾波器為x′(n)＝x(n)-a*x(n-1)，公式中a是常數，x(n)為原信號，x′(n)為預加重信號，n為時域內語音的采樣點；

步驟A2：采用漢明窗對語音信號進行加窗處理；

步驟A3：采用短時平均能量和短時平均過零率的雙門限法對語音信號進行端點檢測。

3.根據權利要求1或2所示的噪聲環境下聲紋識別的語音特征處理方法，其特征在于，所述步驟2，具體步驟如下：

步驟B1：首先利用倒譜法基音檢測估算每一幀語音的基音周期w₀；

步驟B2：對每一幀信號進行快速傅里葉變換，計算譜線能量；

步驟B3：對得到的能量譜求其譜包絡，利用譜包絡平滑函數對譜包絡進行平滑處理；

步驟B4：計算通過Mel濾波器組的能量，計算DCT倒譜得到SFCC。

4.根據權利要求3所示的噪聲環境下聲紋識別的語音特征處理方法，其特征在于，所示步驟B3利用譜包絡平滑函數對譜包絡進行平滑處理具體為：對于一幀語音信號，首先通過在步驟B1中求得的基音頻率w₀；根據基音頻率w₀的頻域數據X[w]，在信號區間[w₀/2,3w₀/2] 內找到波峰A₁及其對應的頻率w₁₁；同樣在信號區間[w₀/2+w₁₁,3w₀/2+w₁₁]內找到波峰A₂及其對應的頻率w₁₂；循環此步驟依次發現{[A_k,w_1k]},k＝1,2,...，一直找到頻域信號的末端；同樣根據其頻域數據X[w]，在信號區間[w₀/2,3w₀/2]內找到波峰B₁及其對應的頻率w₂₁；同樣在信號區間[w₀/2+w₂₁,3w₀/2+w₂₁]內找到波峰B₂及其對應的頻率w₂₂；循環此步驟依次發現 {[B_k,w_2k]},k＝1,2,...，一直找到頻域信號的末端；根據A_k和B_k求得二者的中間值C_k及其對應的頻率w_k；根據兩個相鄰的中間值插值重新估算譜線能量，公式為得到新的能量譜包絡。