[發明專利]一種噪聲環境下聲紋識別的語音特征處理方法有效
| 申請號: | 201610125032.3 | 申請日: | 2016-03-04 |
| 公開(公告)號: | CN105679312B | 公開(公告)日: | 2019-09-10 |
| 發明(設計)人: | 張毅;謝延義;徐曉東;蕭紅;羅久飛;黃超;王可佳;倪雷 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L19/02;G10L21/0332 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 劉小紅 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 噪聲 環境 聲紋 識別 語音 特征 處理 方法 | ||
1.一種噪聲環境下聲紋識別的語音特征處理方法,其特征在于,該方法包括以下幾個 步驟:
步驟1:獲取噪聲環境下的語音信號,根據語音的特點對信號進行前期處理,包括預加 重處理,加窗處理和端點檢測;
步驟2:估算發聲個體的基音周期,并以此為依據對語音信號進行譜平滑處理,得到新 的譜包絡,計算通過梅爾濾波器的能量,最終通過DCT倒譜計算得到SFCC;
步驟3:結合均值消減法、方差歸一化、時間序列濾波法和加權自回歸移動平均濾波法 依次對步驟2得到的SFCC進行后處理,得到最終語音特征MVDA。
2.根據權利要求1所示的噪聲環境下聲紋識別的語音特征處理方法,其特征在于,步驟 1對信號進行前期處理,具體為:步驟A1:根據口腔的輻射響應接近于一階高通函數的特性, 采用的預加重濾波器為x′(n)=x(n)-a*x(n-1),公式中a是常數,x(n)為原信號,x′(n)為預 加重信號,n為時域內語音的采樣點;
步驟A2:采用漢明窗對語音信號進行加窗處理;
步驟A3:采用短時平均能量和短時平均過零率的雙門限法對語音信號進行端點檢測。
3.根據權利要求1或2所示的噪聲環境下聲紋識別的語音特征處理方法,其特征在于, 所述步驟2,具體步驟如下:
步驟B1:首先利用倒譜法基音檢測估算每一幀語音的基音周期w0;
步驟B2:對每一幀信號進行快速傅里葉變換,計算譜線能量;
步驟B3:對得到的能量譜求其譜包絡,利用譜包絡平滑函數對譜包絡進行平滑處理;
步驟B4:計算通過Mel濾波器組的能量,計算DCT倒譜得到SFCC。
4.根據權利要求3所示的噪聲環境下聲紋識別的語音特征處理方法,其特征在于,所示 步驟B3利用譜包絡平滑函數對譜包絡進行平滑處理具體為:對于一幀語音信號,首先通過 在步驟B1中求得的基音頻率w0;根據基音頻率w0的頻域數據X[w],在信號區間[w0/2,3w0/2] 內找到波峰A1及其對應的頻率w11;同樣在信號區間[w0/2+w11,3w0/2+w11]內找到波峰A2及其 對應的頻率w12;循環此步驟依次發現{[Ak,w1k]},k=1,2,...,一直找到頻域信號的末端;同 樣根據其頻域數據X[w],在信號區間[w0/2,3w0/2]內找到波峰B1及其對應的頻率w21;同樣在 信號區間[w0/2+w21,3w0/2+w21]內找到波峰B2及其對應的頻率w22;循環此步驟依次發現 {[Bk,w2k]},k=1,2,...,一直找到頻域信號的末端;根據Ak和Bk求得二者的中間值Ck及其對 應的頻率wk;根據兩個相鄰的中間值插值重新估算譜線能量,公式為 得到新的能量譜包絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610125032.3/1.html,轉載請聲明來源鉆瓜專利網。





