[發明專利]一種語音轉寫文本糾錯模型的訓練方法和計算機設備有效
| 申請號: | 202210928970.2 | 申請日: | 2022-08-03 |
| 公開(公告)號: | CN115293139B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 陳瑋;馮少輝;張建業 | 申請(專利權)人: | 北京中科智加科技有限公司 |
| 主分類號: | G06F40/232 | 分類號: | G06F40/232;G06F40/237;G06F40/289;G06N3/0455;G06N3/08 |
| 代理公司: | 北京天達知識產權代理事務所有限公司 11386 | 代理人: | 龐許倩 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 轉寫 文本 糾錯 模型 訓練 方法 計算機 設備 | ||
本發明涉及一種語音轉寫文本糾錯模型的訓練方法及計算機設備,屬于語音識別技術領域;解決了現有文本糾錯方法在糾錯時無法準確定位到錯詞進行修改,導致針對語音轉寫文本的糾錯準確性不高的問題。本發明的文本糾錯模型訓練方法包括以下步驟:獲取原始語音轉寫文本及對應的文本糾錯后的目標文本,構建訓練樣本集合;計算原始語音轉寫文本與目標文本的編輯距離,基于最小編輯距離得到多條編輯路徑;根據多條編輯路徑構造編輯對齊字符集合;基于編輯對齊字符集合和先驗詞表匹配結果得到每個編輯路徑的頻率得分,根據頻率得分確定最終編輯路徑及長度標簽;將語音轉寫文本、長度標簽和目標文本輸入到多任務模型進行預測,得到語音轉寫文本糾錯模型。
技術領域
本發明涉及語音識別技術領域,特別涉及一種語音轉寫文本糾錯模型的訓練方法和計算機設備。
背景技術
近年來,隨著深度學習技術的快速發展,深度學習在圖像處理、自然語言處理和強化學習中發揮著越來越重要的作用。深度學習的訓練過程是一個基于海量數據的自動特征提取和連續數據擬合的過程,屬于機器學習。深度學習模型能夠自動提取特征,對數據處理或特征工程的要求較低。然而,目前深度學習的方法大多數應用在糾正拼寫錯誤和糾正語法錯誤,專門針對語音轉寫文本的糾錯方案還比較少。
由于語音轉寫文本中的錯誤大多屬于口語化、發音模糊不清而產生的音似錯誤,而且語音轉寫文本的錯誤分布比較稀疏,在糾錯時需要精準定位到錯詞進行修改,對于正確的詞需避免修改,這導致常見的拼寫糾錯算法和語法糾錯算法在語音轉寫文本上的效果并不理想。因此,設計專門的方案對語音轉寫文本進行糾錯成為一項急需解決的難題。
發明內容
鑒于上述的分析,本發明旨在提供一種語音轉寫文本糾錯模型的訓練方法和計算機設備;解決現有技術中的文本糾錯方法在糾錯時無法準確定位到錯詞進行修改,導致針對語音轉寫文本的糾錯準確性不高的問題。
本發明的目的主要是通過以下技術方案實現的:
一方面,本發明提供了一種語音轉寫文本糾錯模型的訓練方法,包括以下步驟:獲取原始語音轉寫文本及對應的文本糾錯后的目標文本,構建訓練樣本集合;
計算所述原始語音轉寫文本與目標文本的編輯距離,基于最小編輯距離得到多條編輯路徑;
根據所述多條編輯路徑構建編輯對齊字符集合,基于所述編輯對齊字符集合中的每個字符在預先構建的詞表中出現的頻率,計算各個候選編輯路徑的頻率得分,選擇得分最高的候選編輯路徑作為最終編輯路徑,并基于最終編輯路徑得到原始語音轉寫文本中每個字符的長度標注標簽;
將所述語音轉寫文本、長度標注標簽和目標文本輸入到多任務模型進行預測,經過損失函數迭代更新,得到語音轉寫文本糾錯模型。
進一步的,所述多任務模型包括長度預測器、長度修正器和糾錯器;
所述長度預測器用于根據所述語音轉寫文本和長度標注標簽對每個字符的長度進行預測并標注;
所述長度修正器用于根據所述長度預測器輸出的語音轉寫文本對應的長度標注,對語音轉寫本文進行修改,得到與對應的目標文本相同長度的待糾錯文本;
所述糾錯器用于根據目標文本對對應的待糾錯文本進行糾錯,得到糾錯后的文本。
進一步的,所述糾錯器為基于Bert的非自回歸糾錯模型,包括文本表示層、全連接層和CRF層;
所述文本表示層,用于對所述待糾錯文本進行文本表示,得到具有上下文信息的n*k矩陣,其中n為句子的最大長度,k為詞向量維度;
所述全連接層,用于根據文本表示層的輸出預測輸入字符映射到輸出字符的概率分布,得到字符預測的發射矩陣;
所述CRF層,基于全連接層的輸出,通過初始化轉移矩陣和損失函數迭代更新,得到每個句子中字符排序的最佳路徑。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科智加科技有限公司,未經北京中科智加科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210928970.2/2.html,轉載請聲明來源鉆瓜專利網。





