[發明專利]一種噪聲環境下聲紋識別的語音特征處理方法有效
| 申請號: | 201610125032.3 | 申請日: | 2016-03-04 |
| 公開(公告)號: | CN105679312B | 公開(公告)日: | 2019-09-10 |
| 發明(設計)人: | 張毅;謝延義;徐曉東;蕭紅;羅久飛;黃超;王可佳;倪雷 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L19/02;G10L21/0332 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 劉小紅 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 噪聲 環境 聲紋 識別 語音 特征 處理 方法 | ||
技術領域
本發明涉及語音信號處理領域,提出一種基于基音特性和噪聲特性的語音特征提 取方法。
背景技術
隨著語音科學與信息通信技術的發展,作為更加便捷的身份驗證技術,聲紋識別 技術取得了顯著的進步。語言作為人類最基礎的自然屬性之一,是人類之間信息傳遞最直 接便捷的方式。作為個體的人的發聲器官不僅與先天因素有關,而且受后天發育環境等因 素的影響較大,因此語音有十分顯著的個體色彩。這種個體上的特點同時衍生了一個科學 研究熱點——聲紋識別。當一個個體在說話人時,所產生的語音與個體的發聲習慣、發聲器 官等因素有關,這些因素是相對穩定的,一般情況下差異較小,因此個體之間的聲紋圖譜都 存在差異。因此人的聲音可以作為人的身份標識,是一個相對穩定的生命信號。聲紋識別就 是將人的發聲特性作為標識,對人的身份進行驗證的一項科學技術。
語音信號中的基音周期是語音的一大特性,它描述了語音激勵源的一個特征。但 由于人的基音周期的范圍很寬,且同一個體在不同的情感環境中發音的基音周期也不相 同,加之基音周期還會受到發音音調的影響,因此將基音作為聲紋特征是比較困難的事情, 而且基音也會通過影響語音特征參數,影響聲紋識別的結果。因此本發明的譜包絡平滑法 正是基于這一特性,去除了基音的影響。
魯棒性是聲紋識別技術的關鍵,一個訓練好的聲紋識別系統通常需要在各種日常 的環境下工作。聲學模型只使用語音樣本庫中的數據進行訓練,而語音的采集通常在低噪 聲的環境下,往往很難與多種噪聲環境相匹配,環境噪聲造成的特征扭曲降低了聲紋識別 的魯棒性。環境噪聲根據其特性可以分為加性噪聲和減性噪聲兩種,如何有效的去除這兩 種噪聲的干擾是關鍵所在。語音特征的后處理算法在前期特征的基礎上進行處理,不僅減 小了算法的復雜性,而且有利于提高語音的聲紋特性。
發明內容
針對以上現有技術的不足,提出了一種方法。本發明的技術方案如下:一種噪聲環 境下聲紋識別的語音特征處理方法,該方法包括以下幾個步驟:
步驟1:獲取噪聲環境下的語音信號,根據語音的特點對信號進行前期處理,包括 預加重處理,加窗處理和端點檢測;
步驟2:估算發聲個體的基音周期,并以此為依據對語音信號進行譜平滑處理,得 到新的譜包絡,計算通過梅爾濾波器的能量,最終通過DCT倒譜計算得到中間信號SFCC;
步驟3:結合均值消減法、方差歸一化、時間序列濾波法和加權自回歸移動平均濾 波法依次對步驟2得到的SFCC進行后處理,得到最終語音特征MVDA。
進一步的,步驟1對信號進行前期處理,具體為:步驟A1:根據口腔的輻射響應接近 于一階高通函數的特性,采用的預加重濾波器為x′(n)=x(n)-a*x(n-1),公式中a是常數,x (n)為原信號,x′(n)為預加重信號,n為時域內語音的采樣點。
步驟A2:采用漢明窗對語音信號進行加窗處理;
步驟A3:采用短時平均能量和短時平均過零率的雙門限法對語音信號進行端點檢 測。
進一步的,所述步驟2,具體步驟如下:
步驟B1:首先利用倒譜法基音檢測估算每一幀語音的基音周期;
步驟B2:對每一幀信號進行快速傅里葉變換,計算譜線能量;
步驟B3:對得到的能量譜求其譜包絡,利用譜包絡平滑函數對譜包絡進行平滑處 理;
步驟B4:計算通過Mel濾波器組的能量,計算DCT倒譜得到SFCC。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610125032.3/2.html,轉載請聲明來源鉆瓜專利網。





