[發(fā)明專利]可快速更新語言模型的大規(guī)模語音識別方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201911420724.0 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111063337B | 公開(公告)日: | 2022-03-25 |
| 發(fā)明(設(shè)計)人: | 陸沁 | 申請(專利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/06;G10L15/08;G10L15/26 |
| 代理公司: | 北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 黃謙;鄧婷婷 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 快速 更新 語言 模型 大規(guī)模 語音 識別 方法 系統(tǒng) | ||
1.一種可快速更新語言模型的大規(guī)模語音識別方法,包括:
步驟S101,獲取多個說法結(jié)構(gòu)語句;每個所述說法結(jié)構(gòu)語句中包括多個類別詞條;
步驟S102,獲取所述多個類別所對應(yīng)的詞條;
步驟S103,根據(jù)所述說法結(jié)構(gòu)語句及所述多個類別的詞條擴展為完整的擴展語音文本;
步驟S104,從所述步驟S101中的說話結(jié)構(gòu)語句中多個類別詞條中,選取多個待更新類別詞條;將含有待更新類別詞條的說法與所述擴展語音文本合并,組成訓(xùn)練語料;訓(xùn)練所述訓(xùn)練語 料獲取說法語言模型;
步驟S105,從所述步驟S101中的說話結(jié)構(gòu)語句中選取頻繁更新的類別詞條為新詞條的類別;按設(shè)定時間或設(shè)定時間間隔從預(yù)設(shè)的詞條數(shù)據(jù)庫中獲取與所述新詞條的類別對應(yīng)的新詞條;將所述新詞條加入對應(yīng)的詞條文本中,并分別訓(xùn)練各類新詞條的詞條語言模型;
步驟S106,從當(dāng)前采集語句中獲取當(dāng)前更新詞條;將所述當(dāng)前更新詞條對應(yīng)加入所述多個類別的詞條中,通過步驟S103的步驟擴展為當(dāng)前語音文本;將所述當(dāng)前語音文本與所述當(dāng)前采集語句合并,組成新的當(dāng)前訓(xùn)練文本;訓(xùn)練所述當(dāng)前訓(xùn)練文本得到當(dāng)前說法語言模型;通過所述當(dāng)前更新詞條更新所述新詞條,將所述新詞條從所述預(yù)設(shè)的詞條數(shù)據(jù)庫中移除;
步驟S107,根據(jù)所述說法語言模型及所述詞條語言模型結(jié)合聲學(xué)模型編譯成解碼網(wǎng)絡(luò);
步驟S108,通過所述解碼網(wǎng)絡(luò)識別當(dāng)前待識別語音,獲取識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的大規(guī)模語音識別方法,其中,所述步驟S101中還包括:采集多段用戶語音;識別所述多段用戶語音獲取多個說法結(jié)構(gòu)語句。
3.根據(jù)權(quán)利要求1所述的大規(guī)模語音識別方法,其中,所述步驟S105中還包括:獲取詞條數(shù)據(jù)庫。
4.根據(jù)權(quán)利要求1所述的大規(guī)模語音識別方法,其中,所述步驟S107中還包括,根據(jù)所述說法語言模型及所述詞條語言模型結(jié)合聲學(xué)模型通過支持class-based解碼的解碼器編譯成解碼網(wǎng)絡(luò)。
5.一種可快速更新語言模型的大規(guī)模語音識別系統(tǒng),包括:
獲取說法結(jié)構(gòu)語句單元,其配置為獲取多個說法結(jié)構(gòu)語句;每個所述說法結(jié)構(gòu)語句中包括多個類別詞條;
詞條獲取單元,其配置為獲取所述多個類別所對應(yīng)的詞條;
擴展單元,其配置為根據(jù)所述說法結(jié)構(gòu)語句及所述多個類別的詞條擴展為完整的擴展語音文本;
說法語言模型獲取單元,其配置為從所述步驟S101中的說話結(jié)構(gòu)語句中多個類別詞條中,選取多個待更新類別詞條;將含有待更新類別詞條的說法與所述擴展語音文本合并,組成訓(xùn)練語料;訓(xùn)練所述訓(xùn)練語 料獲取說法語言模型;
詞條語言模型獲取單元,其配置為從所述步驟S101中的說話結(jié)構(gòu)語句中選取頻繁更新的類別詞條為新詞條的類別;按設(shè)定時間或設(shè)定時間間隔從預(yù)設(shè)的詞條數(shù)據(jù)庫中獲取與所述新詞條的類別對應(yīng)的新詞條;將所述新詞條加入對應(yīng)的詞條文本中,并分別訓(xùn)練各類新詞條的詞條語言模型;
更新單元,其配置為從當(dāng)前采集語句中獲取當(dāng)前更新詞條;將所述當(dāng)前更新詞條對應(yīng)加入所述多個類別的詞條中,通過步驟S103的步驟擴展為當(dāng)前語音文本;將所述當(dāng)前語音文本與所述當(dāng)前采集語句合并,組成新的當(dāng)前訓(xùn)練文本;訓(xùn)練所述當(dāng)前訓(xùn)練文本得到當(dāng)前說法語言模型;通過所述當(dāng)前更新詞條更新所述新詞條,將所述新詞條從所述預(yù)設(shè)的詞條數(shù)據(jù)庫中移除;
解碼單元,其配置為根據(jù)所述說法語言模型及所述詞條語言模型結(jié)合聲學(xué)模型編譯成解碼網(wǎng)絡(luò);
識別結(jié)果獲取單元,其配置為通過所述解碼網(wǎng)絡(luò)識別當(dāng)前待識別語音,獲取識別結(jié)果。
6.根據(jù)權(quán)利要求5所述的大規(guī)模語音識別系統(tǒng),其中,所述獲取說法結(jié)構(gòu)語句單元還配置為采集多段用戶語音;識別所述多段用戶語音獲取多個說法結(jié)構(gòu)語句。
7.根據(jù)權(quán)利要求5所述的大規(guī)模語音識別系統(tǒng),其中,所述詞條語言模型獲取單元,還配置獲取詞條數(shù)據(jù)庫。
8.根據(jù)權(quán)利要求5所述的大規(guī)模語音識別系統(tǒng),其中,所述更新單元還配置為,根據(jù)所述說法語言模型及所述詞條語言模型結(jié)合聲學(xué)模型通過支持class-based解碼的解碼器編譯成解碼網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911420724.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





