[發明專利]一種噪聲環境下聲紋識別的語音特征處理方法有效

申請號：	201610125032.3	申請日：	2016-03-04
公開（公告）號：	CN105679312B	公開（公告）日：	2019-09-10
發明（設計）人：	張毅;謝延義;徐曉東;蕭紅;羅久飛;黃超;王可佳;倪雷	申請（專利權）人：	重慶郵電大學
主分類號：	G10L15/02	分類號：	G10L15/02;G10L19/02;G10L21/0332
代理公司：	重慶市恒信知識產權代理有限公司 50102	代理人：	劉小紅
地址：	400065 ***	國省代碼：	重慶;50
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種噪聲環境聲紋識別語音特征處理方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及語音信號處理領域，提出一種基于基音特性和噪聲特性的語音特征提取方法。

背景技術

隨著語音科學與信息通信技術的發展，作為更加便捷的身份驗證技術，聲紋識別技術取得了顯著的進步。語言作為人類最基礎的自然屬性之一，是人類之間信息傳遞最直接便捷的方式。作為個體的人的發聲器官不僅與先天因素有關，而且受后天發育環境等因素的影響較大，因此語音有十分顯著的個體色彩。這種個體上的特點同時衍生了一個科學研究熱點——聲紋識別。當一個個體在說話人時，所產生的語音與個體的發聲習慣、發聲器官等因素有關，這些因素是相對穩定的，一般情況下差異較小，因此個體之間的聲紋圖譜都存在差異。因此人的聲音可以作為人的身份標識，是一個相對穩定的生命信號。聲紋識別就是將人的發聲特性作為標識，對人的身份進行驗證的一項科學技術。

語音信號中的基音周期是語音的一大特性，它描述了語音激勵源的一個特征。但由于人的基音周期的范圍很寬，且同一個體在不同的情感環境中發音的基音周期也不相同，加之基音周期還會受到發音音調的影響，因此將基音作為聲紋特征是比較困難的事情，而且基音也會通過影響語音特征參數，影響聲紋識別的結果。因此本發明的譜包絡平滑法正是基于這一特性，去除了基音的影響。

魯棒性是聲紋識別技術的關鍵，一個訓練好的聲紋識別系統通常需要在各種日常的環境下工作。聲學模型只使用語音樣本庫中的數據進行訓練，而語音的采集通常在低噪聲的環境下，往往很難與多種噪聲環境相匹配，環境噪聲造成的特征扭曲降低了聲紋識別的魯棒性。環境噪聲根據其特性可以分為加性噪聲和減性噪聲兩種，如何有效的去除這兩種噪聲的干擾是關鍵所在。語音特征的后處理算法在前期特征的基礎上進行處理，不僅減小了算法的復雜性，而且有利于提高語音的聲紋特性。

發明內容

針對以上現有技術的不足，提出了一種方法。本發明的技術方案如下：一種噪聲環境下聲紋識別的語音特征處理方法，該方法包括以下幾個步驟：

步驟1：獲取噪聲環境下的語音信號，根據語音的特點對信號進行前期處理，包括預加重處理，加窗處理和端點檢測；

步驟2：估算發聲個體的基音周期，并以此為依據對語音信號進行譜平滑處理，得到新的譜包絡，計算通過梅爾濾波器的能量，最終通過DCT倒譜計算得到中間信號SFCC；

步驟3：結合均值消減法、方差歸一化、時間序列濾波法和加權自回歸移動平均濾波法依次對步驟2得到的SFCC進行后處理，得到最終語音特征MVDA。

進一步的，步驟1對信號進行前期處理，具體為：步驟A1：根據口腔的輻射響應接近于一階高通函數的特性，采用的預加重濾波器為x′(n)＝x(n)-a*x(n-1)，公式中a是常數，x (n)為原信號，x′(n)為預加重信號，n為時域內語音的采樣點。

步驟A2：采用漢明窗對語音信號進行加窗處理；

步驟A3：采用短時平均能量和短時平均過零率的雙門限法對語音信號進行端點檢測。

進一步的，所述步驟2，具體步驟如下：

步驟B1：首先利用倒譜法基音檢測估算每一幀語音的基音周期；

步驟B2：對每一幀信號進行快速傅里葉變換，計算譜線能量；

步驟B3：對得到的能量譜求其譜包絡，利用譜包絡平滑函數對譜包絡進行平滑處理；