[發(fā)明專利]一種聲紋特征識別方法及系統(tǒng)在審

申請?zhí)枺?/td>	201611075677.7	申請日：	2016-11-29
公開（公告）號：	CN106782565A	公開（公告）日：	2017-05-31
發(fā)明（設(shè)計(jì)）人：	徐曉東;張程;張毅	申請（專利權(quán)）人：	重慶重智機(jī)器人研究院有限公司
主分類號：	G10L17/02	分類號：	G10L17/02;G10L17/26
代理公司：	北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11371	代理人：	唐維虎
地址：	400000 重慶市***	國省代碼：	重慶;85
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種聲紋特征識別方法系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及聲音識別技術(shù)領(lǐng)域，具體而言，涉及一種聲紋特征識別方法及系統(tǒng)。

背景技術(shù)

早在20世紀(jì)30年代，聲紋識別的研究就已經(jīng)在信息科研工作者中展開了。在早期研究中，人耳聽辨(Aural)實(shí)驗(yàn)和聽音識別可行性驗(yàn)證是聲紋識別領(lǐng)域的重點(diǎn)。隨著計(jì)算機(jī)科技在硬件和算法中的突破，聲紋識別的研究不再僅僅局限于單一的人耳聽辨。美國Bell實(shí)驗(yàn)室在語音識別領(lǐng)域長期處于領(lǐng)先位置，實(shí)驗(yàn)室成員L G.Kesta通過對語音頻譜圖的分析完成識別，并由他首先提出了“聲紋識別”這個(gè)概念。隨著科研工作者在聲紋識別領(lǐng)域不斷的探索和創(chuàng)新，使機(jī)器自動(dòng)分析并識別人類語音信號變成可能。但是，目前已有的聲紋特征識別方法在噪聲環(huán)境下的識別準(zhǔn)確率都普遍較低，系統(tǒng)魯棒性差，應(yīng)用效果不佳。

發(fā)明內(nèi)容

本發(fā)明的目的在于提供一種聲紋特征識別方法及系統(tǒng)，以改善上述問題。

本發(fā)明較佳實(shí)施例提供一種聲紋特征識別方法，該方法包括：

對輸入的原始語音信號進(jìn)行預(yù)處理，所述預(yù)處理包括預(yù)加重、分幀加窗以及端點(diǎn)檢測；

對預(yù)處理后得到的含噪混合信號進(jìn)行基于聽覺特性的語音分離處理；

提取經(jīng)語音分離處理后的信號的頻率倒譜系數(shù)和感知線性預(yù)測系數(shù)；

利用噪聲背景區(qū)分度，在不同噪聲環(huán)境下對頻率倒譜系數(shù)和感知線性預(yù)測系數(shù)進(jìn)行分析以完成特征融合；及

在預(yù)先建立的聲紋特征模板庫中，采用高斯混合模型-通用背景模型對已完成融合的特征進(jìn)行模式匹配，實(shí)現(xiàn)聲紋特征識別。

本發(fā)明另一實(shí)施例提供一種聲紋特征識別系統(tǒng)，該系統(tǒng)包括:

預(yù)處理模塊，用于對輸入的原始語音信號進(jìn)行預(yù)處理，所述預(yù)處理包括預(yù)加重、分幀加窗以及端點(diǎn)檢測；

語音分離模塊，用于對預(yù)處理后得到的含噪混合信號進(jìn)行基于聽覺特性的語音分離處理；

特征提取模塊，用于提取經(jīng)語音分離處理后的信號的頻率倒譜系數(shù)和感知線性預(yù)測系數(shù)；

特征融合模塊，用于利用噪聲背景區(qū)分度，在不同噪聲環(huán)境下對頻率倒譜系數(shù)和感知線性預(yù)測系數(shù)進(jìn)行分析以完成特征融合；及

特征識別模塊，用于在預(yù)先建立的聲紋特征模板庫中，采用高斯混合模型-通用背景模型對已完成融合的特征進(jìn)行模式匹配，實(shí)現(xiàn)聲紋特征識別。

本發(fā)明實(shí)施例提供的聲紋特征識別方法及系統(tǒng)，將人類聽覺系統(tǒng)特性與傳統(tǒng)聲紋識別方法相結(jié)合，從仿生學(xué)角度解決噪聲下聲紋識別率降低的問題，有效提升了噪聲環(huán)境下聲紋識別的準(zhǔn)確率和系統(tǒng)的魯棒性。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案，下面將對實(shí)施例中所需要使用的附圖作簡單地介紹，應(yīng)當(dāng)理解，以下附圖僅示出了本發(fā)明的某些實(shí)施例，因此不應(yīng)被看作是對范圍的限定，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。

圖1為本發(fā)明實(shí)施例提供的一種語音識別設(shè)備的方框示意圖；

圖2為本發(fā)明實(shí)施例提供的一種聲紋特征識別方法的流程圖；

圖3為本發(fā)明實(shí)施例提供的雙耳時(shí)間差的幾何原理圖；

圖4為本發(fā)明實(shí)施例提供的一種聲紋特征識別系統(tǒng)的功能模塊框圖。

圖標(biāo)：100-語音識別設(shè)備；110-聲紋特征識別系統(tǒng)；120-存儲器；130-處理器；1102-預(yù)處理模塊；1104-語音分離模塊；1106-特征提取模塊；1108-特征融合模塊；1110-特征識別模塊。

具體實(shí)施方式

為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。因此，以下對在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍，而是僅僅表示本發(fā)明的選定實(shí)施例。基于本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶重智機(jī)器人研究院有限公司，未經(jīng)重慶重智機(jī)器人研究院有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201611075677.7/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：用于處理語音數(shù)據(jù)的方法和裝置
下一篇：收集個(gè)人聲音特征的方法

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L17-00 講話者辨認(rèn)或驗(yàn)證

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】