[發(fā)明專利]一種聲紋特征識別方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201611075677.7 | 申請日: | 2016-11-29 |
| 公開(公告)號: | CN106782565A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計(jì))人: | 徐曉東;張程;張毅 | 申請(專利權(quán))人: | 重慶重智機(jī)器人研究院有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/26 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11371 | 代理人: | 唐維虎 |
| 地址: | 400000 重慶市*** | 國省代碼: | 重慶;85 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 聲紋 特征 識別 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及聲音識別技術(shù)領(lǐng)域,具體而言,涉及一種聲紋特征識別方法及系統(tǒng)。
背景技術(shù)
早在20世紀(jì)30年代,聲紋識別的研究就已經(jīng)在信息科研工作者中展開了。在早期研究中,人耳聽辨(Aural)實(shí)驗(yàn)和聽音識別可行性驗(yàn)證是聲紋識別領(lǐng)域的重點(diǎn)。隨著計(jì)算機(jī)科技在硬件和算法中的突破,聲紋識別的研究不再僅僅局限于單一的人耳聽辨。美國Bell實(shí)驗(yàn)室在語音識別領(lǐng)域長期處于領(lǐng)先位置,實(shí)驗(yàn)室成員L G.Kesta通過對語音頻譜圖的分析完成識別,并由他首先提出了“聲紋識別”這個(gè)概念。隨著科研工作者在聲紋識別領(lǐng)域不斷的探索和創(chuàng)新,使機(jī)器自動(dòng)分析并識別人類語音信號變成可能。但是,目前已有的聲紋特征識別方法在噪聲環(huán)境下的識別準(zhǔn)確率都普遍較低,系統(tǒng)魯棒性差,應(yīng)用效果不佳。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種聲紋特征識別方法及系統(tǒng),以改善上述問題。
本發(fā)明較佳實(shí)施例提供一種聲紋特征識別方法,該方法包括:
對輸入的原始語音信號進(jìn)行預(yù)處理,所述預(yù)處理包括預(yù)加重、分幀加窗以及端點(diǎn)檢測;
對預(yù)處理后得到的含噪混合信號進(jìn)行基于聽覺特性的語音分離處理;
提取經(jīng)語音分離處理后的信號的頻率倒譜系數(shù)和感知線性預(yù)測系數(shù);
利用噪聲背景區(qū)分度,在不同噪聲環(huán)境下對頻率倒譜系數(shù)和感知線性預(yù)測系數(shù)進(jìn)行分析以完成特征融合;及
在預(yù)先建立的聲紋特征模板庫中,采用高斯混合模型-通用背景模型對已完成融合的特征進(jìn)行模式匹配,實(shí)現(xiàn)聲紋特征識別。
本發(fā)明另一實(shí)施例提供一種聲紋特征識別系統(tǒng),該系統(tǒng)包括:
預(yù)處理模塊,用于對輸入的原始語音信號進(jìn)行預(yù)處理,所述預(yù)處理包括預(yù)加重、分幀加窗以及端點(diǎn)檢測;
語音分離模塊,用于對預(yù)處理后得到的含噪混合信號進(jìn)行基于聽覺特性的語音分離處理;
特征提取模塊,用于提取經(jīng)語音分離處理后的信號的頻率倒譜系數(shù)和感知線性預(yù)測系數(shù);
特征融合模塊,用于利用噪聲背景區(qū)分度,在不同噪聲環(huán)境下對頻率倒譜系數(shù)和感知線性預(yù)測系數(shù)進(jìn)行分析以完成特征融合;及
特征識別模塊,用于在預(yù)先建立的聲紋特征模板庫中,采用高斯混合模型-通用背景模型對已完成融合的特征進(jìn)行模式匹配,實(shí)現(xiàn)聲紋特征識別。
本發(fā)明實(shí)施例提供的聲紋特征識別方法及系統(tǒng),將人類聽覺系統(tǒng)特性與傳統(tǒng)聲紋識別方法相結(jié)合,從仿生學(xué)角度解決噪聲下聲紋識別率降低的問題,有效提升了噪聲環(huán)境下聲紋識別的準(zhǔn)確率和系統(tǒng)的魯棒性。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實(shí)施例,因此不應(yīng)被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
圖1為本發(fā)明實(shí)施例提供的一種語音識別設(shè)備的方框示意圖;
圖2為本發(fā)明實(shí)施例提供的一種聲紋特征識別方法的流程圖;
圖3為本發(fā)明實(shí)施例提供的雙耳時(shí)間差的幾何原理圖;
圖4為本發(fā)明實(shí)施例提供的一種聲紋特征識別系統(tǒng)的功能模塊框圖。
圖標(biāo):100-語音識別設(shè)備;110-聲紋特征識別系統(tǒng);120-存儲器;130-處理器;1102-預(yù)處理模塊;1104-語音分離模塊;1106-特征提取模塊;1108-特征融合模塊;1110-特征識別模塊。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。因此,以下對在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶重智機(jī)器人研究院有限公司,未經(jīng)重慶重智機(jī)器人研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611075677.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





