[發明專利]一種會議場景小樣本條件下的聲紋識別方法在審
| 申請號: | 202011038136.3 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112259107A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 張暉;趙夢;趙海濤;孫雁飛;朱洪波 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G10L17/06 | 分類號: | G10L17/06;G10L17/16;G10L17/02;G10L25/24 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210012 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 會議 場景 樣本 條件下 聲紋 識別 方法 | ||
本發明公開了一種會議場景小樣本條件下的聲紋識別方法,首先,對采集到的說話人語音進行預處理,提取梅爾頻率倒譜系數MFCC及其一階差分系數ΔMFCC和高斯頻率倒譜系數GFCC及其一階差分系數ΔGFCC;其次,利用高斯混合模型?通用背景模型HMM?UBM對語音信號進行時序建模,使用RVM學習得到每位說話人語音的分類信息;最后,通過對待識別人建立HMM模型,并將相關向量機RVM作為分類器進行判決決策得到分類結果。本發明大幅降低了識別算法的錯誤接收概率和錯誤拒絕概率,且不會影響用戶信息安全。
技術領域
本發明屬于智能會議領域,具體涉及一種基于會議場景小樣本條件下的聲紋識別方法。
背景技術
在會議場景下,由于會議安排時間大都非常緊湊,留給采集音頻的時間很有限。其次,說話人主觀上也不太愿意花費很長時間在采集音頻上;再者,被采集語音的說話人也無法在短期時間內,將自己的聲紋特征全都展現出來,因此很難在會議場景下采集到足夠的訓練樣本。大多數情況下,采集到的語音大都是同--種腔調,無法完全展示說話人的聲紋特征,無法完全囊括不同條件下說話人自身的差異特征。不僅在會議場景下,在其他場景下也是如此,根本無法完成采集足夠樣本的需求,這將直接導致了聲紋識別系統中只能使用小樣本完成模型的訓練。
在聲紋識別系統中采用小樣本訓練模型,將帶來很多難以預想的問題:首先,樣本點少,無法完全覆蓋用戶的聲紋個性特征,從而,小樣本下提取的特征將很難區分出不同的說話人,這將直接導致識別準確率低的問題;再者,小樣本訓練時,樣本缺失將導致模型很難收斂,無法達到訓練出能完整描述聲紋特征分布模型的目標;此外,小樣本條件下訓練出的模型會偏離正確的聲紋特征分布,無法達到最優的處理結果,還有可能帶來非常嚴重的過擬合現象;除此之外,樣本點少,將嚴重限制聲紋識別技術的作用領域,由于樣本點的不足,在多人聲紋識別領域,系統所能區分的總人數非常有限,這將嚴重降低用戶對聲紋識別系統的使用體驗。
目前,語音識別系統常采用高斯混合模型-通用背景模型(GMM-UBM),應用話者聲道信息并通過全局背景模型解決訓練樣本少的問題。此外隨著人工智能網絡(ANN)、支持向量機(SVM)等機器學習方法的不斷成熟,也出現類似GMM-SVM的融合算法。而ANN是一個高度非線性的大型網絡,需要大量的訓練樣本才能得到效果較好的模型,導致其難以應用于實際。
發明內容
發明目的:為克服以上技術問題本發明提出一種會議場景小樣本條件下的聲紋識別方法,大幅降低了識別算法的錯誤接收概率和錯誤拒絕概率。
發明內容:本發明提供一種會議場景小樣本條件下的聲紋識別方法,具體包括以下步驟:
(1)對采集到的說話人語音進行預處理,提取梅爾頻率倒譜系數及其一階差分系數和高斯頻率倒譜系數及其一階差分系數共振峰;
(2)利用HMM-UBM對語音信號進行時序建模,使用RVM學習得到每位說話人語音的分類信息;
(3)通過對待識別人建立HMM模型,并將RVM作為分類器進行判決決策得到分類結果。
進一步地,所述步驟(1)包括以下步驟:
(11)對語音信息進行采樣量化、DFT操作后通過Mel頻率濾波器組,然后取對數,DCT求倒譜得到MFCC參數,并求得其一階差分倒譜系數;
(12)對語音信號進行快速傅里葉變換,取絕對值后通過Gammatone濾波器組,取對數后進行離散傅里葉變換求得GFCC參數,并求得其一階差分倒譜系數;
(13)混合特征參數,將MFCC、ΔMFCC、GFCC、ΔGFCC作為混合特征參數;
(14)采用線性判別分析LDA進行特征轉換,實現數據降維,使新特征更具區分性。
進一步地,步驟(2)所述的時序建模過程如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011038136.3/2.html,轉載請聲明來源鉆瓜專利網。





