[發(fā)明專利]一種用于低信噪比環(huán)境下的語種識別特征融合方法在審
| 申請?zhí)枺?/td> | 202011154249.X | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112331178A | 公開(公告)日: | 2021-02-05 |
| 發(fā)明(設(shè)計)人: | 邵玉斌;劉晶;龍華;杜慶治;李一民;楊貴安;唐維康;陳亮 | 申請(專利權(quán))人: | 昆明理工大學(xué) |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/02 |
| 代理公司: | 北京方圓嘉禾知識產(chǎn)權(quán)代理有限公司 11385 | 代理人: | 王月松 |
| 地址: | 650500 云南省昆*** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 低信噪 環(huán)境 語種 識別 特征 融合 方法 | ||
本發(fā)明針對目前技術(shù)工程應(yīng)用困難和低信噪比下識別率低的問題公開了一種用于低信噪比環(huán)境下語種識別的特征融合方法,屬于語音識別領(lǐng)域。語種識別提取有效特征減少噪聲影響是識別準(zhǔn)確的關(guān)鍵。本發(fā)明主要采用音節(jié)分割、CFCC系數(shù)、主成分分析和Teager能量算子倒譜參數(shù)。本發(fā)明對全語音段進行音節(jié)分割,再對每個音節(jié)語音段提取CFCC系數(shù);使用PCA技術(shù)對提取的CFCC系數(shù)進行主成分分析,從每個音節(jié)對應(yīng)的F幀中選取貢獻率最高的前S幀;為了提高特征的魯棒性,融合基于音節(jié)提取的Teager能量算子倒譜參數(shù)得到融合特征集。將提取的融合特征集輸入到語種識別模型中訓(xùn)練出對應(yīng)語種識別模型,把訓(xùn)練好的語種模型掛載到服務(wù)器端,再通過客戶端采集要識別的語音輸入到服務(wù)器,提取融合特征并與訓(xùn)練好的語種模型進行打分判決,最后輸出識別結(jié)果返回客戶端。經(jīng)過測試,本文方法可以提高語種識別在低信噪比環(huán)境下準(zhǔn)確率,且運行速度快,計算量少。
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于低信噪比環(huán)境下語種識別的特征融合方法,屬于語音識別領(lǐng)域。
背景技術(shù)
隨著全球化和人類命運共同體穩(wěn)步前進的形式下,語種識別問題也逐漸得到重視。不同國家人民之間的交流問題是全球化發(fā)展的一大阻礙,人們已經(jīng)不能滿足于僅僅通過鍵盤和顯示器與智能設(shè)備進行信息交互,而是迫切需要以一種更自然、更能為多數(shù)人所接受的方式與智能設(shè)備進行溝通交流,讓計算機能聽懂人話,或是用語音來控制各種智能設(shè)備。使用人類交換信息最直接最方便的語言來與計算機通信,一直以來都是一個備受關(guān)注同時也極具挑戰(zhàn)的研究課題。隨著社會的快速發(fā)展,越來越多的專家開始研究多語種的理解系統(tǒng)以及語音識別等問題,其中,語種識別問題也得到了高度重視。目前,語種識別技術(shù)已大量運用在軍事安全及多語種信息服務(wù)領(lǐng)域。當(dāng)前語種識別技術(shù)對無噪語種識別的準(zhǔn)確率已經(jīng)足夠好,但低信噪比下語種的識別率還需要提升。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于提高低信噪比下語種識別的準(zhǔn)確性和魯棒性。本發(fā)明在特征提取前端引入音節(jié)分割,然后分別提取每個音節(jié)的GTCC特征參數(shù),再利用PCA技術(shù)對提取特征進行降維優(yōu)化為了提高特征的魯棒性,將每個音節(jié)提取的Teager能量算子倒譜參數(shù)(s-TEOCC)的和s-GTCC+PCA融合,從而獲得最優(yōu)特征集S-EGTCC,最后采用語種識別系統(tǒng)進行模型訓(xùn)練,將訓(xùn)練好的模型掛載到服務(wù)器上,通過客戶端和服務(wù)器結(jié)合形成一個完整的語種識別系統(tǒng)。為了解決以上技術(shù)問題,本發(fā)明采用如下技術(shù)方案:一種用于低信噪比環(huán)境下的語種識別特征融合方法。該方法包括以下步驟:
S1、基于音節(jié)分割后的GFCC特征提取
其步驟包括音節(jié)分割、Gammatone濾波、分幀加窗、計算短時對數(shù)能量、計算DCT倒譜、s-GFCC特征提取。
S1.1、音節(jié)分割
音節(jié)分割后能有效的去掉背景噪聲部分,也最大程度上減少噪聲特征的影響。對全語音段進行音節(jié)切割后可以獲取多個音節(jié)段的起始點和終點從而得到每個音節(jié)的時間長度形成音節(jié)語音段:
其中j表示第j個音節(jié),V是音節(jié)個數(shù),對x(j)(t)采樣后得到對應(yīng)音節(jié)j上的離散時間信號x(j)(n),n為采樣點序列。
S1.2、Gammatone濾波
音節(jié)語音段x(j)(n)通過濾波器濾波,在時域等同于x(j)(n)與濾波器g(i)(t)卷積:
y(i,j)(n)=x(j)(n)*g(i)(t),0<i≤N (2)
其中,y(i,j)(n)為濾波后的信號,i是指第i個Gammatone濾波器(共有N個)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011154249.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測終端和環(huán)境檢測系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計裝置和環(huán)境估計方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測儀(環(huán)境貓)





