[發明專利]一種語音識別文本的校正方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201811549312.2 | 申請日: | 2018-12-18 |
| 公開(公告)號: | CN109710929A | 公開(公告)日: | 2019-05-03 |
| 發明(設計)人: | 曾晶;鄧理平;陳桓;張良杰 | 申請(專利權)人: | 金蝶軟件(中國)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/31;G10L15/26 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 校正 候選文本 文本 語音識別文本 編輯距離 拼音 計算機設備 存儲介質 聲音單元 整體認讀音節 篩選 聲母 韻母 語音識別 模糊音 語料庫 準確率 長時 申請 | ||
本申請涉及一種語音識別文本的校正方法、裝置、計算機設備和存儲介質。方法包括:獲取經語音識別得到的識別文本中各個詞的拼音;基于語料庫和所述各個詞的拼音中聲音單元的模糊音確定候選文本;所述聲音單元包括聲母、韻母和整體認讀音節中的至少一種;根據所述識別文本和所述候選文本間的詞數差、拼音總字母數和詞總數,確定所述候選文本對應的編輯距離;按照所述編輯距離從所述候選文本中篩選出校正文本。采用本方法提出的編輯距離方法來篩選候選文本的校正文本,在識別文本較長時,可有效的校正語音識別文本,提高校正的準確率。
技術領域
本申請涉及計算機技術領域,特別是涉及一種語音識別文本的校正方法、裝置、計算機設備和存儲介質。
背景技術
隨著互聯網的發展,語音識別技術已經得到越來越廣泛的應用。語音識別技術是機器通過識別和理解將輸入的語音信號轉變成相應的文本,實現人與機器的交流互動。
目前,大部分語音識別技術采用人工智能方法來自動識別語音,然而該語音識別技術的準確率容易受到環境、人的發音等因素的影響,準確率低。
發明內容
基于此,有必要針對上述技術問題,提供一種語音識別文本的校正方法、裝置、計算機設備和存儲介質。
一種語音識別文本的校正方法,所述方法包括:
獲取經語音識別得到的識別文本中各個詞的拼音;
基于語料庫和所述各個詞的拼音中聲音單元的模糊音確定候選文本;所述聲音單元包括聲母、韻母和整體認讀音節中的至少一種;
根據所述識別文本和所述候選文本間的詞數差、拼音總字母數和詞總數,確定所述候選文本對應的編輯距離;
按照所述編輯距離從所述候選文本中篩選出校正文本。
在其中一個實施例中,所述獲取經語音識別得到的識別文本中各個詞的拼音包括:
獲取經語音識別得到的識別文本;
對所述識別文本進行分詞,獲得詞序列;
從所述詞序列中刪除屬于停用詞表的詞,得到經過預處理的識別文本;
確定經過預處理的識別文本中各個詞的拼音。
在其中一個實施例中,所述基于語料庫和所述各個詞的拼音中聲音單元的模糊音確定候選文本,包括:
將所述各個詞的拼音中的聲音單元替換為相應的模糊音,得到候選詞拼音;
基于所述候選詞拼音按照倒排索引在語料庫中查詢相應候選詞所在語句;
從查詢到的所述語句中,按照所述識別文本和所述語句間的編輯距離,篩選出候選文本。
在其中一個實施例中,所述語料庫的生成步驟包括:
獲取初始語料庫;
提取所述初始語料庫中語句的關鍵詞;
將所述語句中的所述關鍵詞替換為所述關鍵詞的同義詞,得到擴充語句;
在所述初始語料庫中添加所述擴充語句,得到語料庫。
在其中一個實施例中,所述方法還包括:
通過詞向量模型,確定所述關鍵詞的詞向量和候選詞的詞向量;
根據所述關鍵詞的詞向量和所述候選詞的詞向量確定所述關鍵詞和候選詞的相似度;
根據所述相似度確定所述關鍵詞的同義詞。在其中一個實施例中,所述候選文本對應的編輯距離與所述詞數差的絕對值正相關,且與所述拼音總字母數正向關,且與所述詞總數負相關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于金蝶軟件(中國)有限公司,未經金蝶軟件(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811549312.2/2.html,轉載請聲明來源鉆瓜專利網。





