[發明專利]一種語音識別文本的校正方法、裝置、計算機設備和存儲介質在審

申請號：	201811549312.2	申請日：	2018-12-18
公開（公告）號：	CN109710929A	公開（公告）日：	2019-05-03
發明（設計）人：	曾晶;鄧理平;陳桓;張良杰	申請（專利權）人：	金蝶軟件（中國）有限公司
主分類號：	G06F17/27	分類號：	G06F17/27;G06F16/31;G10L15/26
代理公司：	廣州華進聯合專利商標代理有限公司 44224	代理人：	何平
地址：	518000 廣東省深圳市南山區***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	校正候選文本文本語音識別文本編輯距離拼音計算機設備存儲介質聲音單元整體認讀音節篩選聲母韻母語音識別模糊音語料庫準確率長時申請
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請涉及一種語音識別文本的校正方法、裝置、計算機設備和存儲介質。方法包括：獲取經語音識別得到的識別文本中各個詞的拼音；基于語料庫和所述各個詞的拼音中聲音單元的模糊音確定候選文本；所述聲音單元包括聲母、韻母和整體認讀音節中的至少一種；根據所述識別文本和所述候選文本間的詞數差、拼音總字母數和詞總數，確定所述候選文本對應的編輯距離；按照所述編輯距離從所述候選文本中篩選出校正文本。采用本方法提出的編輯距離方法來篩選候選文本的校正文本，在識別文本較長時，可有效的校正語音識別文本，提高校正的準確率。

技術領域

本申請涉及計算機技術領域，特別是涉及一種語音識別文本的校正方法、裝置、計算機設備和存儲介質。

背景技術

隨著互聯網的發展，語音識別技術已經得到越來越廣泛的應用。語音識別技術是機器通過識別和理解將輸入的語音信號轉變成相應的文本，實現人與機器的交流互動。

目前，大部分語音識別技術采用人工智能方法來自動識別語音，然而該語音識別技術的準確率容易受到環境、人的發音等因素的影響，準確率低。

發明內容

基于此，有必要針對上述技術問題，提供一種語音識別文本的校正方法、裝置、計算機設備和存儲介質。

一種語音識別文本的校正方法，所述方法包括：

獲取經語音識別得到的識別文本中各個詞的拼音；

基于語料庫和所述各個詞的拼音中聲音單元的模糊音確定候選文本；所述聲音單元包括聲母、韻母和整體認讀音節中的至少一種；

根據所述識別文本和所述候選文本間的詞數差、拼音總字母數和詞總數，確定所述候選文本對應的編輯距離；

按照所述編輯距離從所述候選文本中篩選出校正文本。