[發(fā)明專利]基于自聯(lián)想神經(jīng)網(wǎng)絡(luò)和高斯混合背景模型相結(jié)合的說(shuō)話人確認(rèn)方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200910024432.5 | 申請(qǐng)日: | 2009-02-24 |
| 公開(公告)號(hào): | CN101814159A | 公開(公告)日: | 2010-08-25 |
| 發(fā)明(設(shè)計(jì))人: | 余華;戴紅霞;陳存寶;趙力;魏昕;奚吉;王青云;梁瑞宇 | 申請(qǐng)(專利權(quán))人: | 余華 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G10L17/00 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 210096 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 聯(lián)想 神經(jīng)網(wǎng)絡(luò) 混合 背景 模型 相結(jié)合 說(shuō)話 確認(rèn) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種說(shuō)話人確認(rèn)方法,特別涉及一種基于自聯(lián)想神經(jīng)網(wǎng)絡(luò)和高斯混合背景模型相結(jié)合的說(shuō)話人確認(rèn)方法。?
背景技術(shù)
在門禁、信用卡交易和法庭證據(jù)等方面,自動(dòng)說(shuō)話人確認(rèn),特別是與文本無(wú)關(guān)的說(shuō)話人確認(rèn)起著越來(lái)越重要的作用,它的目標(biāo)是確認(rèn)待測(cè)說(shuō)話人是否是所稱的那個(gè)人。?
在說(shuō)話人確認(rèn)方法上,基于高斯混合背景模型(GMM-UBM)方法越來(lái)越受到重視,由于它具有識(shí)別率高,訓(xùn)練簡(jiǎn)單,訓(xùn)練數(shù)據(jù)量要求不大等優(yōu)點(diǎn),已經(jīng)成為目前主流的識(shí)別方法。基于高斯混合模型超向量的支持向量機(jī)(SVM)和因子分析方法則代表GMM-UBM方法的最新成果,它們利用GMM-UBM模型訓(xùn)練獲取均值超向量,利用投影或因子分析方法對(duì)均值超向量進(jìn)行處理,再利用SVM或其它方法進(jìn)行確認(rèn)。由于高斯混合模型(GMM)具有很好的表示數(shù)據(jù)的分布的能力,只要有足夠多的項(xiàng),足夠多的訓(xùn)練數(shù)據(jù),GMM就能夠逼近任何分布模型。但是,GMM只能逼近數(shù)據(jù)分布,對(duì)底層數(shù)據(jù)分布的改變無(wú)能為力,它不能對(duì)數(shù)據(jù)作任何變換,或者說(shuō)不能改變數(shù)據(jù)的分布;另外,在選擇GMM模型時(shí),通常取各個(gè)高斯分布的方差矩陣為對(duì)角矩陣,這個(gè)假設(shè)也不是很合理,這樣要求高斯混合項(xiàng)足夠多;還有由于訓(xùn)練和確認(rèn)時(shí)信道可能不匹配會(huì)導(dǎo)致確認(rèn)率降低。?
自聯(lián)想神經(jīng)網(wǎng)絡(luò)(AANN)在說(shuō)話人識(shí)別方面也占有重要的位置,多層感知器(MLP)、射線基(RadialBasis)網(wǎng)絡(luò)、時(shí)延網(wǎng)絡(luò)(TDNN)等已經(jīng)成功應(yīng)用于說(shuō)話人識(shí)別,并且取得很好的識(shí)別效果。神經(jīng)網(wǎng)絡(luò)對(duì)特征向量進(jìn)行變換,通過(guò)學(xué)習(xí),使變換得到的特征向量以某種方式逼近目標(biāo)向量,逼近的準(zhǔn)則通常是最小均方誤差(MMSE)準(zhǔn)則。可以預(yù)見(jiàn)的是,如果將神經(jīng)網(wǎng)絡(luò)技術(shù)和高斯混合背景模型相結(jié)合起來(lái),將會(huì)大大提高系統(tǒng)的識(shí)別率,但是目前還沒(méi)有出現(xiàn)此類方法。?
發(fā)明內(nèi)容
本發(fā)明的目的就在于解決現(xiàn)有技術(shù)的缺陷,提出了基于自聯(lián)想神經(jīng)網(wǎng)絡(luò)和高斯混合背景模型相結(jié)合的說(shuō)話人確認(rèn)方法。本發(fā)明的技術(shù)方案是:?
基于自聯(lián)想神經(jīng)網(wǎng)絡(luò)和高斯混合背景模型相結(jié)合的說(shuō)話人確認(rèn)方法,其特征在于包括以下步驟:?
在訓(xùn)練時(shí),利用自聯(lián)想神經(jīng)網(wǎng)絡(luò)(AANN)對(duì)特征向量進(jìn)行變換,并且學(xué)習(xí)特征向量集的結(jié)構(gòu),然后把學(xué)習(xí)結(jié)果以殘差特征向量(即輸入向量與AANN網(wǎng)絡(luò)的輸出之差)的形式提供給高斯混合模型(GMM),進(jìn)行GMM模型訓(xùn)練;?
通過(guò)一個(gè)兩階段方法來(lái)訓(xùn)練這個(gè)通用背景模型和說(shuō)話人模型,訓(xùn)練AANN網(wǎng)絡(luò)的過(guò)程和訓(xùn)練GMM模?型的過(guò)程交替進(jìn)行;訓(xùn)練通用背景模型的GMM時(shí)采用期望最大(EM)方法,訓(xùn)練目標(biāo)說(shuō)話人模型的GMM時(shí)用最大后驗(yàn)概率(MAP)方法,訓(xùn)練AANN時(shí)采用帶慣性的反向傳播(BP)向后反演法;?
在進(jìn)行說(shuō)話人確認(rèn)時(shí),由于AANN網(wǎng)絡(luò)已經(jīng)學(xué)習(xí)了目標(biāo)說(shuō)話人特征空間的結(jié)構(gòu),所以輸入特征向量,AANN網(wǎng)絡(luò)會(huì)把特征向量作適當(dāng)?shù)淖儞Q,然后提供給GMM模型,而會(huì)起到增強(qiáng)目標(biāo)特征的似然概率,降低非目標(biāo)特征的似然概率。在所述的基于自聯(lián)想神經(jīng)網(wǎng)絡(luò)和高斯混合背景模型相結(jié)合的說(shuō)話人確認(rèn)方法中,所述的通用背景模型訓(xùn)練過(guò)程如下:?
(1)確定GMM模型和AANN網(wǎng)絡(luò)結(jié)構(gòu);?
(2)設(shè)定收斂條件和最大迭代次數(shù);?
(3)隨機(jī)確定AANN網(wǎng)絡(luò)和GMM模型參數(shù);?
(4)把背景特征向量輸入AANN網(wǎng)絡(luò),得到所有的殘差向量;?
(5)固定AANN網(wǎng)絡(luò)參數(shù),利用如下各式修正GMM模型各個(gè)高斯分布的權(quán)系數(shù),均值和方差(可由均方值和均值得到):?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于余華,未經(jīng)余華許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910024432.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





