[發明專利]去除聲紋識別情感語音干擾的方法及系統在審
| 申請號: | 201310736944.0 | 申請日: | 2013-12-27 |
| 公開(公告)號: | CN103730113A | 公開(公告)日: | 2014-04-16 |
| 發明(設計)人: | 黃偉 | 申請(專利權)人: | 黃偉 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L17/00;G10L21/02 |
| 代理公司: | 蘇州翔遠專利代理事務所(普通合伙) 32251 | 代理人: | 劉計成 |
| 地址: | 200001 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 去除 聲紋 識別 情感 語音 干擾 方法 系統 | ||
技術領域
本發明涉及聲紋識別領域,特別涉及一種在進行聲紋識別時能去除情感語音干擾的方法,以及實現這種方法的系統。
背景技術
聲紋識別是一種通過人的語音信號中所蘊含的生理與行為特征,自動辨別身份的生物特征識別技術。經過數十年的技術探索與積累,聲紋識別系統的性能已經取得了巨大進展,但在實際應用中還面臨著一些挑戰,其中,人自身狀態的變化會對聲紋識別系統造成相當程度的不利影響。如今智能交互技術愈發普遍,而語音交互無疑是智能交互的主要交互方式之一,如何提高語音交互過程中用戶使用的流暢性尤為重要,即在用戶帶有情感發出聲紋驗證指令時,聲紋認證系統依然能夠對其進行準確識別,會給交互帶來更加自然、友好的感受。
現有的聲紋識別技術在解決情感差異的問題上還不是很理想,現有的方法包括在特征上或模型上,大多先進行情感辨別技術,把語音劃分給某一類情感屬性,再通過情感屬性間的映射關系將特征或模型映射到中性或與其匹配的聲音情感類別,然后再進行匹配。這種方法存在著諸多問題,首先,人的情感是非常豐富的,有限的情感類別標簽無法覆蓋人的情感空間,其次,就情感識別技術本身來說,其識別精度還未能達到一個很高的水平,所以這種技術雖然能在某些特定情感數據集上獲得一些性能提升,但究其本質是無法解決情感語音差異性問題的。
發明內容
鑒于以上所述現有技術的缺點,本發明的一個目的在于提供一種識別精度高,可有效去除聲紋識別中情感因素干擾的方法,本發明的另一個目的是提供一種識別精度高,可有效去除聲紋識別中情感因素干擾的系統。
為實現上述目的及其他相關目的,本發明提供一種去除聲紋識別情感語音干擾的方法,其包括如下步驟:
1)建立情感去除模型;
2)在進行聲紋識別時,首先提取語音數據的原始特征參數,然后計算其相應的特征向量參數;
3)將計算得到的特征向量參數中所含有的情感因素信息通過情感去除模型進行消除;
4)將去除情感因素信息的語音數據進行聲紋識別。
優選地,建立情感去除模型包括如下步驟:首先建立一情感語音數據庫,用于收集各種情感的語音,將情感語音數據庫中的語音按發音者的身份及情感類型進行標注;提取每條語音的特征參數,計算出每條語音的特征向量參數;將標注的身份信息與計算出每條語音的特征向量參數通過統計學習的方法即可計算出情感去除模型。
優選地,所述統計學習的方法可以采用主元分析技術方法或因子分析技術方法。
優選地,計算每條語音的特征向量參數可利用事先訓練生成的通用背景模型將語音特征映射到高維超向量空間的方法來計算特征向量參數。
優選地,計算每條語音的特征向量參數可將語音特征直接映射到其它維度變換空間的方法來計算特征向量參數。
優選地,語音進行特征向量提取時應事先進行降噪、濾波處理。
本發明還公開了一種采用上述方法去除聲紋識別情感語音干擾系統,其包括:特征向量提取單元,所述特征向量提取單元用于計算情感語音數據庫中每條語音的特征向量參數;情感去除模型單元,所述情感去除模型單元用于將語音數據中情感因素信息進行去除;聲紋識別單元,所述聲紋識別單元用于將去除情感因素信息干擾的語音進行聲紋識別。
優選地,該系統還包括一降噪、濾波處理單元,所述降噪、濾波單元用于對進入特征向量提取單元內的語音數據進行降噪、濾波處理。
如上所述,本發明的去除聲紋識別情感語音干擾的方法及系統具有以下有益效果:該方法通過建模方式建立統一的情感去除模型,無需標注各種具體情感類型數據,無需對某種情感類型單獨建模,可以使得模型建立過程的復雜度大大降低;該方法并不將某一語音硬性分配給某一離散的、具體的情感類別,而是統一計算其情感分量,可以使情感去除模型具備更良好的推廣和泛化能力;該方法可以直接加在現有任何主流聲紋識別系統上,實現簡單、方便;本發明提出的情感模型的建模和匹配方法,可以充分學習情感語音所含有的情感信息,進而進行去除,大幅提高聲紋識別系統對情感因素的魯棒性。
附圖說明
圖1為本發明實施例情感去除模型建立示意圖。
圖2為本發明實施例語音特征向量參數提取的流程圖。
圖3為多個原始特征映射為單個特征向量的示意圖。
圖4為本發明實施例抗情感干擾的聲紋識別系統框圖。
圖5為為本發明實施例情感信息去除的流程圖。
圖6為本發明實施例的系統框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于黃偉,未經黃偉許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310736944.0/2.html,轉載請聲明來源鉆瓜專利網。





