[發(fā)明專利]用于語音識別的n元文法模型構(gòu)造方法及語音識別系統(tǒng)在審
| 申請?zhí)枺?/td> | 201410342840.6 | 申請日: | 2014-07-17 |
| 公開(公告)號: | CN105261358A | 公開(公告)日: | 2016-01-20 |
| 發(fā)明(設(shè)計)人: | 張晴晴;陳夢喆;潘接林;顏永紅 | 申請(專利權(quán))人: | 中國科學(xué)院聲學(xué)研究所;北京中科信利技術(shù)有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/06 |
| 代理公司: | 北京方安思達(dá)知識產(chǎn)權(quán)代理有限公司 11472 | 代理人: | 王宇楊;呂愛霞 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 語音 識別 文法 模型 構(gòu)造 方法 系統(tǒng) | ||
1.一種用于語音識別的n元文法模型構(gòu)造方法,所述方法包含:
步驟101)通過神經(jīng)網(wǎng)絡(luò)語言模型訓(xùn)練得到詞矢量,再對詞矢量進(jìn)行分類以及多層篩選,最終得到詞類;
步驟102)利用直接統(tǒng)計詞頻的方法擴(kuò)充人工標(biāo)注,即同類詞替換時,直接統(tǒng)計與原句有變化的1至n元文法組合,進(jìn)而得到擴(kuò)充部分的n元文法模型;
步驟103)人工標(biāo)注生成初步的n元文法模型,再與擴(kuò)充部分的n元文法模型進(jìn)行模型插值,得到最終的n元文法模型。
2.根據(jù)權(quán)利要求1所述的用于語音識別的n元文法模型構(gòu)造方法,其特征在于,所述步驟101)進(jìn)一步包含:
步驟101-1)輸入標(biāo)注及訓(xùn)練文本;
步驟101-2)通過神經(jīng)網(wǎng)絡(luò)語言模型訓(xùn)練得到詞典中的詞的相應(yīng)詞矢量;
步驟101-3)用K均值法對詞矢量分類,其中詞矢量間的相似程度用余弦相似度進(jìn)行統(tǒng)計;
步驟101-4)對分類結(jié)果進(jìn)行多層篩選,最終得到詞類。
3.根據(jù)權(quán)利要求1或2所述的用于語音識別的n元文法模型構(gòu)造方法,其特征在于,所述步驟102)進(jìn)一步包含:
步驟102-1)將標(biāo)注文本中的詞對應(yīng)至步驟101)得到的詞類,由相應(yīng)分類中的詞替換;
步驟102-2)替換過程中,對與替換部分有關(guān)聯(lián)的1至n元文法組合進(jìn)行詞頻信息的統(tǒng)計;
步驟102-3)根據(jù)詞頻信息生成標(biāo)注擴(kuò)充部分的n元文法語言模型B。
4.根據(jù)權(quán)利要求1或2所述的用于語音識別的n元文法模型構(gòu)造方法,其特征在于,所述步驟103)進(jìn)一步包含:
步驟103-1)生成人工標(biāo)注部分的n元文法語言模型A;
步驟103-2)計算模型A和模型B在開發(fā)集上的最佳插值系數(shù),根據(jù)該系數(shù)插值模型A和模型B,得到最終模型。
5.一種語音識別系統(tǒng),所述方法基于權(quán)利要求1-4任意一條權(quán)利要求記載的n元文法模型,其特征在于,所述系統(tǒng)包含:特征提取模塊、聲學(xué)模型和語言模型,以及解碼器;
特征提取模塊,用于將音頻格式的語音文件轉(zhuǎn)換為特征序列O的二進(jìn)制文件;
聲學(xué)模型,用于模擬語音特征和語言層之間的關(guān)系,進(jìn)而為解碼器的識別提供聲學(xué)概率;
語言模型,用于提供語言學(xué)信息,進(jìn)而為解碼器的識別提供詞串先驗概率,該語言模型即采用所述包含標(biāo)注擴(kuò)展內(nèi)容的n元文法模型;
解碼器,用于依據(jù)特征提取模塊輸出的特征序列,和聲學(xué)模型及語言模型提供的相關(guān)概率值進(jìn)行語音識別,進(jìn)而輸出識別結(jié)果文本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院聲學(xué)研究所;北京中科信利技術(shù)有限公司,未經(jīng)中國科學(xué)院聲學(xué)研究所;北京中科信利技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410342840.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





