[發(fā)明專利]一種提高語音識別準(zhǔn)確率的方法與系統(tǒng)在審
| 申請?zhí)枺?/td> | 202310472717.5 | 申請日: | 2023-04-27 |
| 公開(公告)號: | CN116386616A | 公開(公告)日: | 2023-07-04 |
| 發(fā)明(設(shè)計)人: | 劉斌 | 申請(專利權(quán))人: | 齊魯師范學(xué)院 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/26;G10L15/04 |
| 代理公司: | 嘉興亮典知識產(chǎn)權(quán)代理有限公司 33521 | 代理人: | 呂梅 |
| 地址: | 250200*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 提高 語音 識別 準(zhǔn)確率 方法 系統(tǒng) | ||
1.一種提高語音識別準(zhǔn)確率的方法,其特征在于,包括以下步驟:
獲取用戶的錄音信息并生成語音文本信息;
判斷所述語音文本信息與標(biāo)準(zhǔn)語音文本信息的匹配值,以得到第一匹配結(jié)果和第二匹配結(jié)果;
基于所述第一匹配結(jié)果對所述錄音信息進(jìn)行處理并生成調(diào)整文本信息;
基于第二匹配結(jié)果對所述語音文本信息和所述標(biāo)準(zhǔn)語音文本信息進(jìn)行分割并生成第一分割文本信息和第二分割文本信息;
篩選第一分割文本信息與第二分割文本信息中的差異值,對所述差異值進(jìn)行調(diào)整。
2.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法,其特征在于,所述的判斷所述語音文本信息與標(biāo)準(zhǔn)語音文本信息的匹配的步驟,具體包括:
用戶獲取所述語音文本信息,并將語音文本信息與標(biāo)準(zhǔn)語音文本信息進(jìn)行匹配,其中標(biāo)準(zhǔn)語音文本信息由用戶所設(shè)定;
判斷語音文本信息與標(biāo)準(zhǔn)語音文本信息的匹配值;
設(shè)定第一匹配區(qū)間值和第二匹配區(qū)間值,所述第一匹配區(qū)間值為高匹配度區(qū)間值,所述第二匹配區(qū)間值為低匹配度區(qū)間值,若所述匹配值落入所述第一匹配區(qū)間值內(nèi),則輸出第一匹配結(jié)果,若所述匹配值落入第二匹配區(qū)間置內(nèi),則輸出第二匹配結(jié)果。
3.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法,其特征在于,所述基于所述第一匹配結(jié)果對所述錄音信息進(jìn)行處理并生成調(diào)整文本信息的步驟,包括:
設(shè)定第一調(diào)整命令和第二調(diào)整命令,所述第一調(diào)整命令為熟詞語音識別選擇命令,所述第二調(diào)整命令為語音重新輸入選擇命令,所述第一調(diào)整命令和所述第二調(diào)整命令由用戶選擇;
獲取熟詞語音識別庫,并基于所述第一調(diào)整命令和第一匹配結(jié)果對所述用戶錄音信息進(jìn)行熟詞語音識別調(diào)整,生成調(diào)整文本信息;
設(shè)定上述步驟可循環(huán)進(jìn)行數(shù)次,生成新的調(diào)整文本信息。
4.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法,其特征在于,所述基于第二匹配結(jié)果對所述語音文本信息和所述標(biāo)準(zhǔn)語音文本信息進(jìn)行分割并生成第一分割文本信息和第二分割文本信息的步驟,包括:
獲取第二匹配結(jié)果,并對所述語音文本信息與所述標(biāo)準(zhǔn)語音文本信息進(jìn)行比對,以得到對錯標(biāo)注文本信息;
設(shè)定語音文本信息錯詞分割命令和標(biāo)準(zhǔn)語音文本分割命令,基于所述語音文本信息錯詞分割命令對所述對錯標(biāo)注文本信息進(jìn)行分割,輸出第一分割文本信息;
基于所述語音文本信息和所述標(biāo)準(zhǔn)語音文本分割命令,基于所述第一分割文本信息對所述標(biāo)準(zhǔn)語音文本信息進(jìn)行對應(yīng)分割,輸出第二分割文本信息。
5.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法,其特征在于,所述篩選第一分割文本信息與第二分割文本信息中的差異值的步驟,包括:
基于所述第一分割文本信息與所述第二分割文本信息比對的差異值,對所述第一分割文本信息和所述第二分割文本信息再進(jìn)行對應(yīng)分割;
設(shè)定錯詞文本信息區(qū)間值和對詞文本信息區(qū)間值,若所述差異值落入所述錯詞文本信息區(qū)間值內(nèi),輸出錯詞分割文本信息,若所述差異值落入所述對詞文本信息區(qū)間值,則輸出對詞分割文本信息。
6.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法,其特征在于,所述篩選第一分割文本信息與第二分割文本信息中的差異值,并對所述差異值進(jìn)行調(diào)整的步驟之間,還包括:
設(shè)定第一校正命令和第二校正命令,所述第一校正命令為語音聲標(biāo)識別選擇命令,所述第二校正命令為語音重新輸入選擇命令,所述第一校正命令和第二校正命令有用戶選擇;
獲取標(biāo)準(zhǔn)聲標(biāo)識別數(shù)據(jù)庫,并基于所述第一校正命令和所述錯詞分割文本信息對所述用戶的錄音信息進(jìn)行語音聲標(biāo)識別校正,生成校正文本信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于齊魯師范學(xué)院,未經(jīng)齊魯師范學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310472717.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





