[發明專利]語音識別結果處理方法、裝置、電子設備及介質有效
| 申請號: | 201910887114.5 | 申請日: | 2019-09-19 |
| 公開(公告)號: | CN110718226B | 公開(公告)日: | 2023-05-05 |
| 發明(設計)人: | 陳劍超;肖龍源;李稀敏;蔡振華;劉曉葳;王靜 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/01;G06F40/284;G06F40/232 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 結果 處理 方法 裝置 電子設備 介質 | ||
1.一種語音識別結果處理方法,其特征在于,包括:
獲取目標用戶輸入的針對參照詞序列文本的待識別語音信息,并對所述待識別語音信息進行語音識別,得到所述待識別語音信息對應的待標記詞序列文本;
將所述待標記詞序列文本和所述參照詞序列文本進行比對,得到比對結果,并基于所述比對結果確定所述語音識別的字錯率;
將所述待標記詞序列文本進行拼音轉換后,得到待標記詞序列文本對應的標注拼音序列;基于所述比對結果、所述參照詞序列文本對應的參照拼音序列、所述標注拼音序列對所述待標記詞序列文本進行標記,并將標記結果輸出;
所述將所述待標記詞序列文本和所述參照詞序列文本進行比對得到比對結果,并基于所述比對結果確定所述語音識別的字錯率,包括:對所述待標記詞序列文本進行分詞,得到多個待識別詞單元;
將所述多個待識別詞單元與所述參照詞序列文本中的參照詞單元進行比對,確定將所述待標記詞序列文本轉換為所述參照詞序列文本需要更新的待識別詞單元;將所述需要更新的待識別詞單元記為所述比對結果;
基于所述需要更新的待識別詞單元的個數以及所述參照詞序列文本中的參照詞單元的個數,確定所述語音識別的字錯率;
所述基于所述比對結果、所述參照詞序列文本對應的參照拼音序列、所述標注拼音序列對所述待標記詞序列文本進行標記,包括:基于所述需要更新的待識別詞單元和所述標注拼音序列確定所述需要更新的待識別詞單元中每個待識別詞單元對應的標注拼音;
基于所述需要更新的待識別詞單元在所述參照詞序列文本中對應的參照詞單元以及所述參照詞序列文本對應的參照拼音序列,確定所述需要更新的待識別詞單元對應的參照詞單元中每個參照詞單元對應的參照拼音;
根據所述需要更新的待識別詞單元中每個待識別詞單元對應的標注拼音,以及所述需要更新的待識別詞單元對應的參照詞單元中每個參照詞單元對應的參照拼音,確定所述需要更新的待識別詞單元的錯誤類型;
基于所述錯誤類型以及所述錯誤類型對應的標記方式,對所述待標記詞序列文本進行標記;所述方法還包括:在對所述待標記詞序列文本進行標記后,將所述標記結果中的待識別詞單元以及該待識別詞單元對應的參照拼音和標注拼音進行對應存儲;
標記方式可用深顏色字體、加粗或下劃線方式對識別錯誤漢字進行標記,標記之后對用戶進行提示,提示方式可以為將統計錯誤次數在終端輸出窗口進行提示;通過對語音識別文本的漢字拼音標注,可以找出是哪類錯誤類型,同音字識別錯誤和近音字識別錯誤,同時還能對每段錯誤的文字進行定位,提示用戶是否發音不規范;
在對待標記詞序列文本進行語音標記后,可以將參照拼音和標注拼音進行對應記錄存儲,形成糾錯文本,用以日后進一步提高語音識別率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910887114.5/1.html,轉載請聲明來源鉆瓜專利網。





