[發明專利]一種語音文本的糾錯方法及裝置有效
| 申請號: | 202110206015.3 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN113012705B | 公開(公告)日: | 2022-12-09 |
| 發明(設計)人: | 劉璐 | 申請(專利權)人: | 海信視像科技股份有限公司 |
| 主分類號: | G10L21/007 | 分類號: | G10L21/007;G10L15/02;G10L15/08;G10L15/22;G10L15/26;G06F40/253;G06F40/284;G06F40/30 |
| 代理公司: | 北京弘權知識產權代理有限公司 11363 | 代理人: | 郭放;許偉群 |
| 地址: | 266555 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 文本 糾錯 方法 裝置 | ||
1.一種語音文本的糾錯方法,其特征在于,包括:
從用戶輸入的語音數據中提取語音文本,利用詞語檢錯器檢測所述語音文本中是否存在異常單元,在所述語音文本中存在異常單元時,從糾錯詞基準庫中選出與所述異常單元編輯距離小于編輯距離閾值的候選糾錯詞,以及將所述異常單元替換為所述候選糾錯詞,其中,所述詞語檢錯器為基于N-Gram算法創建的;所述候選糾錯詞中的每個字與所述異常單元中對應的每個字的編輯距離均小于所述編輯距離閾值;所述語音文本為中文時,所述編輯距離的計算步驟為:將待計算編輯距離的兩個字的拼音音節中的聲母、韻母以及聲調的三種維度分別比較,計算三種維度的編輯距離,以及將三種維度的編輯距離求和,得到待計算編輯距離的兩個字的編輯距離;中文的拼音音節由聲母、韻母以及聲調三要素組成,所述聲母和所述韻母為獨立的英文字符串,使用字符串的編輯距離方式獲取聲母和韻母的編輯距離;兩個字拼音音節對比時,聲母、韻母、音調三個維度變化對拼音相似度影響不同,當三個維度中兩個及以上同時變化時,拼音相似度差異增加;在計算總編輯距離時,增加正懲罰機制,通過設置正懲值,選擇所述編輯距離閾值;
在所述語音文本中不存在異常單元時,確定所述語音文本正確。
2.根據權利要求1所述的語音文本的糾錯方法,其特征在于,所述詞語檢錯器可框選所述語音文本中的N個字,所述利用詞語檢錯器判斷所述語音文本中是否存在異常單元的具體步驟為:
將所述詞語檢錯器放置在所述語音文本上滑動,在所述詞語檢錯器內的N個字同時出現的條件概率大于等于經驗概率閾值時,確定所述詞語檢錯器內的N個字不為異常單元;
在所述詞語檢錯器內的N個字同時出現的條件概率小于所述經驗概率閾值時,確定所述詞語檢錯器內的N個字為異常單元。
3.根據權利要求1所述的語音文本的糾錯方法,其特征在于,在將所述異常單元替換為所述候選糾錯詞之后,所述方法還包括:
利用概率上下文無關文法對糾錯后的所述語音文本進行校驗。
4.根據權利要求3所述的語音文本的糾錯方法,其特征在于,所述利用概率上下文無關文法對糾錯后的所述語音文本進行校驗的具體步驟為:
按照訓練好的語法樹模型對糾錯后的所述語音文本執行生成語法樹處理,在糾錯后的所述語音文本可按照訓練好的語法樹模型生成完整的語法樹時,確定糾錯后的所述語音文本正確;
在糾錯后的所述語音文本不可按照訓練好的語法樹模型生成完整的語法樹時,確定糾錯后的所述語音文本不正確。
5.根據權利要求4所述的語音文本的糾錯方法,其特征在于,從糾錯詞基準庫中選出的與所述異常單元編輯距離小于編輯距離閾值的候選糾錯詞為多個,將所述異常單元分別替換為多個所述候選糾錯詞,得到多個糾錯后的所述語音文本;
在多個糾錯后的所述語音文本均可按照訓練好的語法樹模型生成完整的語法樹時,計算多個生成的語法樹的概率,將概率最高的語法樹對應的所述語音文本確定為最終糾錯后的所述語音文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海信視像科技股份有限公司,未經海信視像科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110206015.3/1.html,轉載請聲明來源鉆瓜專利網。





