[發(fā)明專利]一種提高語音識別準(zhǔn)確率的方法與系統(tǒng)在審

申請?zhí)枺?/td>	202310472717.5	申請日：	2023-04-27
公開（公告）號：	CN116386616A	公開（公告）日：	2023-07-04
發(fā)明（設(shè)計）人：	劉斌	申請（專利權(quán)）人：	齊魯師范學(xué)院
主分類號：	G10L15/08	分類號：	G10L15/08;G10L15/26;G10L15/04
代理公司：	嘉興亮典知識產(chǎn)權(quán)代理有限公司 33521	代理人：	呂梅
地址：	250200***	國省代碼：	山東;37
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種提高語音識別準(zhǔn)確率方法系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種提高語音識別準(zhǔn)確率的方法，其特征在于，包括以下步驟：

獲取用戶的錄音信息并生成語音文本信息；

判斷所述語音文本信息與標(biāo)準(zhǔn)語音文本信息的匹配值，以得到第一匹配結(jié)果和第二匹配結(jié)果；

基于所述第一匹配結(jié)果對所述錄音信息進(jìn)行處理并生成調(diào)整文本信息；

基于第二匹配結(jié)果對所述語音文本信息和所述標(biāo)準(zhǔn)語音文本信息進(jìn)行分割并生成第一分割文本信息和第二分割文本信息；

篩選第一分割文本信息與第二分割文本信息中的差異值，對所述差異值進(jìn)行調(diào)整。

2.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法，其特征在于，所述的判斷所述語音文本信息與標(biāo)準(zhǔn)語音文本信息的匹配的步驟，具體包括：

用戶獲取所述語音文本信息，并將語音文本信息與標(biāo)準(zhǔn)語音文本信息進(jìn)行匹配，其中標(biāo)準(zhǔn)語音文本信息由用戶所設(shè)定；

判斷語音文本信息與標(biāo)準(zhǔn)語音文本信息的匹配值；

設(shè)定第一匹配區(qū)間值和第二匹配區(qū)間值，所述第一匹配區(qū)間值為高匹配度區(qū)間值，所述第二匹配區(qū)間值為低匹配度區(qū)間值，若所述匹配值落入所述第一匹配區(qū)間值內(nèi)，則輸出第一匹配結(jié)果，若所述匹配值落入第二匹配區(qū)間置內(nèi)，則輸出第二匹配結(jié)果。

3.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法，其特征在于，所述基于所述第一匹配結(jié)果對所述錄音信息進(jìn)行處理并生成調(diào)整文本信息的步驟，包括：

設(shè)定第一調(diào)整命令和第二調(diào)整命令，所述第一調(diào)整命令為熟詞語音識別選擇命令，所述第二調(diào)整命令為語音重新輸入選擇命令，所述第一調(diào)整命令和所述第二調(diào)整命令由用戶選擇；

獲取熟詞語音識別庫，并基于所述第一調(diào)整命令和第一匹配結(jié)果對所述用戶錄音信息進(jìn)行熟詞語音識別調(diào)整，生成調(diào)整文本信息；

設(shè)定上述步驟可循環(huán)進(jìn)行數(shù)次，生成新的調(diào)整文本信息。

4.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法，其特征在于，所述基于第二匹配結(jié)果對所述語音文本信息和所述標(biāo)準(zhǔn)語音文本信息進(jìn)行分割并生成第一分割文本信息和第二分割文本信息的步驟，包括：

獲取第二匹配結(jié)果，并對所述語音文本信息與所述標(biāo)準(zhǔn)語音文本信息進(jìn)行比對，以得到對錯標(biāo)注文本信息；

設(shè)定語音文本信息錯詞分割命令和標(biāo)準(zhǔn)語音文本分割命令，基于所述語音文本信息錯詞分割命令對所述對錯標(biāo)注文本信息進(jìn)行分割，輸出第一分割文本信息；

基于所述語音文本信息和所述標(biāo)準(zhǔn)語音文本分割命令，基于所述第一分割文本信息對所述標(biāo)準(zhǔn)語音文本信息進(jìn)行對應(yīng)分割，輸出第二分割文本信息。

5.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法，其特征在于，所述篩選第一分割文本信息與第二分割文本信息中的差異值的步驟，包括：

基于所述第一分割文本信息與所述第二分割文本信息比對的差異值，對所述第一分割文本信息和所述第二分割文本信息再進(jìn)行對應(yīng)分割；

設(shè)定錯詞文本信息區(qū)間值和對詞文本信息區(qū)間值，若所述差異值落入所述錯詞文本信息區(qū)間值內(nèi)，輸出錯詞分割文本信息，若所述差異值落入所述對詞文本信息區(qū)間值，則輸出對詞分割文本信息。

6.根據(jù)權(quán)利要求1所述的一種提高語音識別準(zhǔn)確率的方法，其特征在于，所述篩選第一分割文本信息與第二分割文本信息中的差異值，并對所述差異值進(jìn)行調(diào)整的步驟之間，還包括：

設(shè)定第一校正命令和第二校正命令，所述第一校正命令為語音聲標(biāo)識別選擇命令，所述第二校正命令為語音重新輸入選擇命令，所述第一校正命令和第二校正命令有用戶選擇；

獲取標(biāo)準(zhǔn)聲標(biāo)識別數(shù)據(jù)庫，并基于所述第一校正命令和所述錯詞分割文本信息對所述用戶的錄音信息進(jìn)行語音聲標(biāo)識別校正，生成校正文本信息。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于齊魯師范學(xué)院，未經(jīng)齊魯師范學(xué)院許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202310472717.5/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】