[發(fā)明專利]用于說話人識別的多背景模型建立方法有效
| 申請?zhí)枺?/td> | 201010118149.1 | 申請日: | 2010-03-04 |
| 公開(公告)號: | CN101833951A | 公開(公告)日: | 2010-09-15 |
| 發(fā)明(設(shè)計)人: | 張衛(wèi)強;劉加 | 申請(專利權(quán))人: | 清華大學 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/02 |
| 代理公司: | 北京眾合誠成知識產(chǎn)權(quán)代理有限公司 11246 | 代理人: | 朱琨 |
| 地址: | 100084 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 說話 識別 背景 模型 建立 方法 | ||
1.用于說話人識別的多背景模型建立方法,其特征在于,所述方法是在數(shù)字集成電路芯片中依次按以下步驟實現(xiàn)的:
步驟(1):采用Baum-Welch算法,用訓練通用背景模型UBM的所有數(shù)據(jù)訓練一個高斯混合模型GMMΛ0;
步驟(2):求取每段語音的聲道長度彎折系數(shù),具體做法為:
步驟(2.1):聲道長度彎折系數(shù)α從0.88以步長0.02變化到1.12,對信號頻譜進行“彎折”,設(shè)彎折前后的頻率為f,fα,頻譜的低通和高通截止頻率為fl,fu,則彎折公式為
其中
步驟(2.2):對步驟(2.1)中每個彎折系數(shù)對應(yīng)的頻譜求取Mel頻率倒譜系數(shù)MFCC特征搜索使所述特征對模型Λ0的似然度最大的彎折系數(shù):
α*即為該段語音的聲道長度彎折系數(shù);
步驟(3):將訓練UBM的數(shù)據(jù)按聲道長度彎折系數(shù)分成8份,其中α*=0.88的為第1份,α*=0.90的為第2份,α*=0.92的為第3份,α*=0.94的為第4份,α*=0.96,0.98的為第5份,α*=1.00,1.02的為第6份,α*=1.04,1.06的為第7份,α*=1.08,1.10,1.12的為第8份,這樣劃分是由于考慮各份中數(shù)據(jù)量的平衡,采用所述Baum-Welch算法用每份數(shù)據(jù)訓練一個UBM模型;
步驟(4):用目標說話人的訓練語音提取所述MFCC特征,并對8個UBM模型分別進行最大后驗概率MAP自適應(yīng),得到8個GMM模型,具體自適應(yīng)方法為:
步驟(4.1):假設(shè)其中一個UBM的參數(shù)為wm、μm和σm2分別表示權(quán)重、均值和方差,其數(shù)值由步驟(3)中的Baum-Welch算法得到,權(quán)重滿足下標m表示高斯分量標號,共含M個高斯分量,假設(shè)訓練語音共含T幀特征,其中第t幀特征為ot,則ot屬于第m個高斯分量的后驗概率為:
其中(·)表示高斯分布的概率密度,對t=1,...,T,m=1,...,M進行循環(huán),計算每幀特征屬于每個高斯分量的后驗概率;
步驟(4.2):將后驗概率以及后驗概率與特征的乘積對所有幀進行累加,計算零階和一階統(tǒng)計量:
對m=1,...,M進行循環(huán),計算每個高斯分量的零階和一階統(tǒng)計量;
步驟(4.3):對一階統(tǒng)計量和UBM的均值進行線性插值,得到自適應(yīng)后的GMM模型的均值:
其中插值系數(shù)為λm=nm/(nm+r),r為常數(shù),取值為16,對m=1,...,M進行循環(huán),計算GMM模型的每個高斯分量的均值,其權(quán)重和方差直接采用UBM的對應(yīng)的權(quán)重和方差;
步驟(5):對于測試語音提取MFCC特征,然后分別用8組GMM和UBM模型求取對數(shù)似然比分數(shù),從中選取最小的一個作為分數(shù)輸出,具體方法為:
步驟(5.1):假設(shè)測試語音共含Te幀特征,則一組GMM和UBM模型的對數(shù)似然比分數(shù)為:
步驟(5.2):按步驟(5.1)所述求取8組的對數(shù)似然比分數(shù),從中選取最小的一個作為輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學,未經(jīng)清華大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010118149.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





