[發明專利]一種用于語音識別系統的中心子帶模型自適應方法有效
| 申請號: | 201410695733.1 | 申請日: | 2014-11-26 |
| 公開(公告)號: | CN104392719B | 公開(公告)日: | 2017-09-19 |
| 發明(設計)人: | 呂勇 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙)32204 | 代理人: | 李玉平 |
| 地址: | 211100 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 語音 識別 系統 心子 模型 自適應 方法 | ||
技術領域
本發明屬于語音識別技術領域,具體涉及到用測試環境下的少量自適應語音調整訓練環境下得到的聲學模型的參數,使之與實際環境相匹配,提高語音識別系統魯棒性的模型自適應方法。
背景技術
由于環境噪聲、說話人的改變等因素的存在,實際環境與訓練環境往往存在較大的差異,這會導致語音識別系統的性能急劇下降。魯棒語音識別的目的就是減小環境失配的影響,提高語音識別系統在實際應用中的識別性能。
一般來說,魯棒語音識別算法可以劃分為兩類:前端特征域方法和后端模型域方法。在前端特征補償中,對測試環境下提取的特征參數進行補償,使之與預先訓練的聲學模型相匹配。在后端,對預先訓練的聲學模型的參數進行調整,使之與當前環境下的特征參數相匹配,這類方法稱為模型自適應。相對于前端特征補償,模型自適應能同時減小語音變異性和環境噪聲的影響,因而可以得到更好的補償效果。
為了解決數據稀疏問題,最大似然線性回歸(MLLR:Maximum Likelihood Linear Regression)算法假設環境失配只影響聲學模型每個高斯單元的均值向量,因而只需要將訓練環境聲學模型的每個均值向量變換到測試環境,即可得到與當前環境匹配的測試環境均值向量。在MLLR算法中,屬于多個高斯單元的自適應數據被用于估計同一組變換參數,因而可以提高數據稀疏時參數估計的準確性。
在子帶算法中,Mel濾波器組的全部通道被劃分為幾個子帶,假設同一個子帶內的所有通道共享同一個環境變換函數,因此可以進一步增加參數估計的數據量,提高模型自適應的精度。然而,這種子帶假設也會給模型變換帶來不利影響,因為不同通道的環境變換關系實際上是不同的。尤其當一個子帶包含較多Mel通道時,第一個和最后一個通道的頻域距離較遠,因而它們的環境變換關系可能存在較大的差異,假設它們符合同一個環境變換函數,有可能導致不準確的參數估計和模型變換。
發明內容
發明目的:針對現有技術中存在的問題,本發明提供了一種用于語音識別系統的中心子帶模型自適應方法,在該方法中,假設Mel濾波器組的每個通道與其相鄰的通道共享自適應數據,以增加參數估計的數據量;同時,估得的變換參數僅用于當前中心通道,不用于其他通道,每個通道有各自的環境變換關系。在中心子帶自適應模塊中,利用測試環境下的少量自適應語音對訓練環境下生成的聲學模型進行參數變換,得到測試環境聲學模型,然后直接對測試語音進行聲學解碼,得到識別結果。
技術方案:一種用于語音識別系統的中心子帶模型自適應方法,包括:
(1)IDCT:對訓練環境聲學模型每個高斯單元的倒譜均值進行逆離散余弦變換(IDCT:Inverse Discrete Cosine Transform),得到訓練環境對數譜域均值向量。
(2)Mel通道分類:將Mel濾波器組全部通道上的環境變換參數劃分為Nm類,每一類包括若干個通道上的變換參數。
(3)子帶參數估計:對每一類參數,通過對Mel濾波器組全部通道的一次子帶劃分及其子帶自適應估得。Nm類參數估計可以通過并行計算,提高計算速度。
(4)對數譜域模型變換:經過Nm次子帶自適應,得到變換參數后,即可對訓練環境對數譜域均值向量進行變換,得到測試環境對數譜域均值向量。
(5)DCT:對測試環境對數譜域均值向量進行離散余弦變換(DCT:Discrete Cosine Transform),得到測試環境倒譜均值向量,從而得到測試環境聲學模型。
有益效果:與現有技術相比,本發明通過Mel濾波器組的每個通道與其相鄰的通道共享自適應數據,增加參數估計的數據量;同時,估得的變換參數僅用于當前中心通道,不用于其相鄰通道。每個通道都與各自的相鄰通道共享自適應數據,得到各自的環境變換參數。本發明可以提高非平穩環境下自適應數據稀疏時語音識別系統的性能,提高系統的魯棒性。
附圖說明
圖1為聲學識別過程框架圖;
圖2為本發明實施例的方法流程圖。
具體實施方式
下面結合具體實施例,進一步闡明本發明,應理解這些實施例僅用于說明本發明而不用于限制本發明的范圍,在閱讀了本發明之后,本領域技術人員對本發明的各種等價形式的修改均落于本申請所附權利要求所限定的范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410695733.1/2.html,轉載請聲明來源鉆瓜專利網。





