[發明專利]一種用于語音識別系統的中心子帶模型自適應方法有效
| 申請號: | 201410695733.1 | 申請日: | 2014-11-26 |
| 公開(公告)號: | CN104392719B | 公開(公告)日: | 2017-09-19 |
| 發明(設計)人: | 呂勇 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙)32204 | 代理人: | 李玉平 |
| 地址: | 211100 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 語音 識別 系統 心子 模型 自適應 方法 | ||
1.一種用于語音識別系統的中心子帶模型自適應方法,其特征在于,具體包括:
(1)、中心子帶變換
用連續密度隱馬爾可夫模型HMM作為語音識別系統每個語音單元的聲學模型,HMM的第i個狀態的概率密度函數可以表示為:
其中,ot表示第t幀MFCC特征向量,cim、μim和Σim分別表示第i個狀態的第m個高斯單元的混合系數、均值向量和協方差矩陣,D表示特征向量的維數,即Mel濾波器組的通道數目;
為了構建與μim的簡單變換關系,首先通過逆離散余弦變換將μim變換回對數譜域:
uim=C-1μim(2)
其中,C-1表示離散余弦變換的逆矩陣,uim是訓練環境的對數譜域均值向量;
然后,假設在Mel濾波器組的每個Mel通道上,通過線性變換得到測試環境的對數譜域均值向量
其中和uim(k)分別表示向量和uim在第k個Mel通道上的元素,a(k)和b(k)為第k個Mel通道上的線性變換系數;
以當前Mel通道為中心通道,Nm個通道共享同一個線性變換,即當前第k個通道與其前和后個通道共享線性變換系數a(k)和b(k);但是,當a(k)和b(k)從自適應數據中估得后,它們僅僅用于第k個通道的參數變換,不會用于其他Nm-1個通道;以每個Mel通道為中心通道,與其臨近的Nm個通道共享數據,即可得到每個通道的變換參數;實際上,Mel濾波器組每個通道的參數沒有必要逐個估計,將Mel濾波器組的D個通道劃分為個子帶后,不同子帶中相同序號通道的參數可以在一次子帶自適應中完成,這里的ceil(x)表示取不小于x的最小正整數;為此,構建如下子帶濾波器ek:
其中ek(l)表示ek的第l個元素,D表示Mel濾波器組的通道數目;因此,第k個通道的環境變換可以表示為:
其中Uim表示以向量uim的元素為對角元素生成的對角矩陣;表示測試環境對數譜域均值向量的第k個分量,它的維數與uim相同;除第k個子帶外,的其他元素都是0;
(2)、子帶自適應及參數估計
在子帶自適應中,a(k)和b(k)被劃分為Nm類,第p類包括以下參數:
在第p類參數ap、bp的估計中,Mel濾波器組的全部D個通道被劃分為Jp個子帶,其中心通道分別為通道p,Nm+p,2Nm+p,...;因此,訓練環境對數譜域均值向量uim可以分解為:
其中,ej表示第j個子帶的單位向量;在ej中,這個子帶上的對應元素為1,其他元素為0;因此,測試環境均值分量與訓練環境均值分量Uimej的關系可以表示為:
其中,和分別表示第j個子帶的線性變換系數;將所有測試環境均值分量相加,即可得到測試環境的對數譜域均值向量
對上式兩邊取DCT變換,即可得到測試環境的倒譜均值向量
將上式的表示為矩陣形式:
其中,
在式(13)中,子帶變換系數和通過期望最大算法從測試環境下的少量自適應語音中估計,期望最大算法的輔助函數構造如下:
其中,γim(t)=P(θt=i,kt=m|O,λ),表示給定觀測向量序列O={o1,…,ot,…,oT}和先驗參數集λ的條件下,第t幀向量屬于第i個狀態的第m個高斯單元的后驗概率;
將式(11)的代入輔助函數并令對向量的導數為0,即可得到:
得到子帶回歸系數和后,第p類中心子帶變換參數ap和bp可以通過下式計算:
其中,ap(k)和bp(k)分別為ap和bp的第k個元素;Dp表示ap和bp的向量維數;Jp是子帶數目;由式(16)和(17)可知,如果Jp=Dp+1且則和的最后一個子帶分量無效;如果Jp=Dp+1且則和的第一個子帶分量無效;
(3)、對數譜域模型變換及DCT
通過對Mel濾波器組的Nm次不同劃分及其子帶自適應,即可根據式(6)得到中心子帶變換的全部變換參數a(k)和b(k),k=1,2,3,…,D;
得到子帶變換參數a(k)和b(k)后,即可用式(3)對聲學模型的每個訓練環境對數譜域均值向量進行變換,得到測試環境對數譜域均值向量最后對進行DCT變換,得到測試環境倒譜均值向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410695733.1/1.html,轉載請聲明來源鉆瓜專利網。





