[發明專利]一種兩階段稀疏分解的說話人識別方法與裝置在審
| 申請號: | 201410231798.0 | 申請日: | 2014-05-29 |
| 公開(公告)號: | CN105139855A | 公開(公告)日: | 2015-12-09 |
| 發明(設計)人: | 何勇軍;孫廣路;付茂國 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 李迪 |
| 地址: | 150080 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 階段 稀疏 分解 說話 識別 方法 裝置 | ||
技術領域
本發明涉及語音信號處理中的說話人識別領域,尤其涉及一種兩階段稀疏分解的說話人識別方法與裝置。
背景技術
目前,說話人識別在身份鑒別,網絡監控,電話監聽以及信息安全等領域有著廣泛應用。經過幾十年的廣泛研究,典型的識別系統如高斯混合-通用背景模型(GMM-UBM)方法,高斯混合模型-支持向量機方法(GMM-SVM)和聯合因素分析等方法,在理想的條件下取得了滿意的效果。但是在噪聲環境下,其性能將急劇下降,這限制了這些技術的廣泛應用。
研究者們提出了兩類方法以增強說話人識別的噪聲魯棒性。第一類方法是提取對噪聲魯棒的特征,例如線性預測系數(LPCC),梅爾倒譜系數(MFCC)和感知線性預測系數(PLP)等。這些方法僅僅有限的提高,因為沒有特征具有只表示語音而不表示噪聲的選擇能力。第二類方法是在有噪聲語音中采用增強的方法去除噪聲,例如譜相減和維納濾波,然后從增強的語音中提取特征。不幸的是,多數噪聲是非穩定的,甚至有些噪聲像語音,很難對其建模并估計。結果,語音增強方法不可避免會引起更大的畸變,這影響了目前的說話人識別方法,因此,人們希望能有新的技術來解決這個難題。
在過去數年中,稀疏編碼被廣泛的研究,為噪聲環境下的說話人識別提供了可能的解決方法。該技術用一組原子(基元信號)來表示信號,原子的集合叫被稱為字典。通過稀疏編碼,用少量原子的線性組合表示信號的全部或大部分信息。最近,一個叫做形態成分分析(MCA)的稀疏編碼方法被成功用于說話人識別。基于這項技術,每個說話人都準備一個字典,所有的說話人字典被拼接成一個大字典。在識別中,測試的語音通過大字典被稀疏地表示。理論上,一個說話人說的話僅僅能被這個說話人的字典表示,因此,稀疏表示可以直接用于分類。
幾乎所有說話人識別的方法都用了MCA的框架,這些方法首先把訓練語音轉變為GMM均值超級向量或者總變異的向量,然后把這些向量組成一個大字典,用這個大字典進行稀疏分解和分類。據報道,這些方法比傳統的GMM-UBM和GMM-SVM方法有更好的性能。但是這些方法仍然沒有考慮對噪聲進行補償,這降低了這些方法在噪聲情況下的識別率。
發明內容
本發明所要解決的技術問題是,針對現有技術的不足,如何提供一種方法考慮對說話人識別中的噪聲進行補償,提高說話人語音在噪聲情況下的識別率的關鍵問題。
為此目的,本發明提出了一種兩階段稀疏分解的說話人識別方法,包括具體以下步驟:
S1:對輸入的語音的離散時間信號進行分幀與加窗處理;
S2:對每一幀信號作離散傅立葉變換并求幅度值,把幅度譜作為特征進行提取;
S3:構建一個大字典,其中,所述大字典包括通用的背景字典、不同說話人的特征字典和噪聲字典;
S4:進行第一階段稀疏分解來獲得待識別語音在所述大字典上的稀疏表示,并對輸入語音作粗分類獲得部分目標說話人的字典;
S5:對所述部分目標說話人字典進行拼接,進行第二階段稀疏分解,利用稀疏表示確認最終識別說話人。
具體地,所述加窗處理為漢明窗、漢寧窗或矩形窗。
為此目的,本發明還提出了一種兩階段稀疏分解的說話人識別裝置,包括:
分幀與加窗模塊,用于對輸入的語音的離散時間信號進行分幀與加窗處理;
特征提取模塊,用于對每一幀信號作離散傅立葉變換并求幅度值,把幅度譜作為特征進行提取;
構建字典模塊,用于構建一個大字典,其中,所述大字典包括通用的背景字典、不同說話人的特征字典和噪聲字典;
第一階段稀疏分解模塊,用于進行第一階段稀疏分解來獲得待識別語音在所述大字典上的稀疏表示,并對輸入語音作粗分類獲得部分目標說話人的字典;
第二階段稀疏分解模塊,用于對所述部分目標說話人字典進行拼接,進行第二階段稀疏分解,利用稀疏表示確認最終識別說話人。
具體地,所述加窗處理為漢明窗、漢寧窗或矩形窗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410231798.0/2.html,轉載請聲明來源鉆瓜專利網。





