[發(fā)明專利]一種基于小波包分解及混合高斯模型估計的語音識別方法無效
| 申請?zhí)枺?/td> | 200710061240.2 | 申請日: | 2007-09-28 |
| 公開(公告)號: | CN101188107A | 公開(公告)日: | 2008-05-28 |
| 發(fā)明(設計)人: | 李春利;董冠靈;郭倩;肖春景;張敏 | 申請(專利權(quán))人: | 中國民航大學 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/02;G10L15/06;G10L15/14;G10L15/28;G10L19/12 |
| 代理公司: | 天津佳盟知識產(chǎn)權(quán)代理有限公司 | 代理人: | 侯力 |
| 地址: | 300300*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 波包 分解 混合 模型 估計 語音 識別 方法 | ||
1.一種基于小波包分解及混合高斯模型估計的語音識別方法,其特征在于該方法的具體步驟如下:
第1、對已知語音訓練樣本數(shù)據(jù)進行預處理,得到標準化的M維特征向量;
第2、對上步得到的訓練樣本的特征向量進行n級小波包分解,得到訓練樣本在各個頻段上的分解值;其中n=log2(M)-1,頻段個數(shù)為Sf=M/2;
第3、按照類別、頻段將上步得到的訓練樣本的小波包分解值動態(tài)聚類成子類,計算每個子類的均值向量和協(xié)方差矩陣;
第4、為每類訓練樣本在各個頻段構(gòu)造高斯模型集;
第5、按照類別計算訓練樣本頻段之間的前向轉(zhuǎn)移概率矩陣和后向轉(zhuǎn)移概率矩陣;
第6、導入所有訓練樣本的高斯模型集,計算待測試樣本的分布概率;
第7、計算待測試樣本的分布概率的估計值,判斷待測試樣本的類別。
2.如權(quán)利要求1所述的語音識別方法,其特征在于,第1步對語音訓練樣本數(shù)據(jù)進行預處理的方法是:
第1.1、對每個訓練樣本語音數(shù)據(jù)(xi)1×N首先進行快速傅立葉變換;
第1.2、提取訓練樣本的1到M維特征向量y=(y1,y2,…,yM)∈RM,其中M為維數(shù),按照內(nèi)積空間RM中的距離‖y‖=<y,y>1/2,其中(·,·)表示內(nèi)積空間的內(nèi)積,把向量y標準化,即
3.如權(quán)利要求2所述的語音識別方法,其特征在于,其中維數(shù)M取2048,1024、512、256、128、或64中任一數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國民航大學,未經(jīng)中國民航大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710061240.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種消除高硫石油焦燃燒煙氣中硫的方法
- 下一篇:真空充氮食品包裝機





