[發明專利]一種語音識別糾錯方法及人機對話系統有效

申請號：	201910717838.5	申請日：	2019-08-05
公開（公告）號：	CN110428822B	公開（公告）日：	2022-05-03
發明（設計）人：	蘭飛	申請（專利權）人：	重慶電子工程職業學院
主分類號：	G10L15/18	分類號：	G10L15/18;G10L15/22;G10L15/26;G10L15/04;G06F40/232
代理公司：	重慶強大凱創專利代理事務所(普通合伙) 50217	代理人：	陳家輝
地址：	401331 重***	國省代碼：	重慶;50
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音識別糾錯方法人機對話系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明涉及語音識別糾錯技術領域，具體為一種語音識別糾錯方法及人機對話系統，該方法包括以下步驟：獲取語音識別結果和候選語義片段以及語音識別結果的拼音和候選語義片段的拼音；將語音識別結果和候選語義片段進行組合，形成若干新的糾錯文本，計算糾錯文本的組合分數，根據組合分數篩選糾錯文本得到糾錯候選列表；語言模型優化步驟，利用語言模型計算語言模型評分，并根據組合分數和語言模型評分生成最終糾錯列表。本發明提供的一種語音識別糾錯方法及人機對話系統，可以在語音識別錯誤后，更加準確的匹配出糾錯文本，有效的減少語音識別的結果對中文人機對話流程的跳轉影響，提高人機對話質量。

技術領域

本發明涉及語音識別糾錯技術領域，具體為一種語音識別糾錯方法及人機對話系統。

背景技術

人機對話技術的研究最早可以追溯到上世紀六十年代，自阿蘭·圖靈提出通過圖靈測試來檢驗機器是否具有人類智能的設想以來，研究人員就開始致力于人機對話系統的研究。目前，市面上有眾多人機對話的產品，如智能語音助手、電話機器人等，這些產品中語音識別技術都是非常重要的模塊。由于用戶的非標準化表達、方言、環境噪聲等因素，導致錯誤的語音識別結果，這是導致人機對話失敗的主要原因。

我國語音識別研究工作起步于五十年代，近年來由于深度學習技術的推動，語音識別技術發展很快。我國語音識別技術的研究水平已經基本上與國外同步，在漢語語音識別技術上還有自己的特點與優勢，并達到國際先進水平。國內語音識別技術領先的單位有科大訊飛、阿里、百度等互聯網巨頭廠商。這些廠商在漢語語音識別上投入了巨大的人力和財力，在各類學術競賽中獲得領先水平，在實際的工業生產中，收集了大量的模型訓練語料，在短時間內形成了語音識別的技術高地。目前，考慮到語音識別的效果，國內很多的人機交互產品選擇采用互聯網巨頭語音識別技術。但是，在特定的交互場景下，互聯網巨頭語音識別技術仍有很大的不足，尤其是大量環境噪聲下的短文本識別。此時，由于無法直接修改語音識別模型，只能夠致力于將語音識別結果映射到場景相關的文本上去。在人機對話過程中，預設了用戶的說話語義范圍，而在語音識別中并沒有這個假設，所以，采用中文人機對話中的候選語料糾正語音識別結構，對于提高人機對話質量有重要的意義。

發明內容

本發明意在提供一種語音識別糾錯方法及一種人機對話系統，可以在語音識別錯誤后，更加準確的匹配出糾錯文本，有效的減少語音識別的結果對中文人機對話流程的跳轉影響，提高人機對話質量。

為了解決上述技術問題，本申請提供如下技術方案：

一種語音識別糾錯方法，包括以下步驟：

獲取語音識別結果和候選語義片段以及語音識別結果的拼音和候選語義片段的拼音；

將語音識別結果和候選語義片段進行組合，形成若干新的糾錯文本，計算語音識別結果和候選語義片段的拼音相似度和糾錯文本的組合分數，根據組合分數篩選糾錯文本得到糾錯候選列表；

語言模型優化步驟，利用語言模型計算語言模型評分，并根據組合分數和語言模型評分生成最終糾錯列表。

本發明技術方案中，通過使用拼音空間相似度算法，并采用了動態規劃方法計算最優語義文本組合，形成糾錯候選列表，可以更加準確的匹配出正確的語義文本，并且，通過采用拼音空間相似度算法和語言模型融合的方式，不僅僅從發音上，更結合字符串之間本身的語義關系，可以避免糾錯候選列表中存在語序不通、同音錯別字等問題，進一步提高匹配的準確度。將其應用于人機對話系統后，可以有效的減少語音識別的結果對中文人機對話流程的跳轉影響，提高人機對話質量。

進一步，計算各個語義文本的拼音相似度評分具體包括以下步驟：

計算語音識別結果的拼音對應的字符串的子字符串和候選語義片段之間的拼音相似度，形成相似度矩陣M_k；

根據拼音相似度計算組合分數；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于重慶電子工程職業學院，未經重慶電子工程職業學院許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910717838.5/2.html，轉載請聲明來源鉆瓜專利網。