[發明專利]訓練數據更新方法及系統、語音識別方法及系統、設備在審
| 申請號: | 202011073681.6 | 申請日: | 2020-10-09 |
| 公開(公告)號: | CN112216284A | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 羅超;任君;胡泓;李巍 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 楊東明;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 數據 更新 方法 系統 語音 識別 設備 | ||
本發明公開了一種訓練數據更新方法及系統、語音識別方法及系統、設備。其中,語音識別模型的訓練數據更新方法包括以下步驟:將目標場景下的目標音頻數據輸入第一語音識別模型,得到第一文本;將所述目標音頻數據輸入第二語音識別模型,得到第二文本;比較所述第一文本和所述第二文本,得到目標核心詞;根據所述目標核心詞在所述目標音頻數據中的目標位置,從包括所述目標位置以及所述目標位置附近的部分目標音頻數據中選取標注數據;將所述標注數據以及對應的標注文本更新至所述第二語音識別模型的訓練數據中。本發明能夠實現自動補充核心詞,從而提高第二語音識別模型的更新效率,進而提高語音識別的準確率。
技術領域
本發明涉及語音識別領域,特別涉及一種語音識別模型的訓練數據更新方法及系統、語音識別方法及系統、電子設備以及存儲介質。
背景技術
目前,針對場景模型建模的技術,主要包括全景建模策略和增量建模策略,這些策略都是基于GMM-HMM(高斯混合模型-隱馬爾科夫模型)、DNN-HMM(深度神經網絡-隱馬爾科夫模型)、DeepSpeech2(一種采用端到端自動語音識別引擎的開源項目)為代表的聲學模型建模技術:
1)全量建模策略,是直接按照全場景訓練的模型,將訓練完成的模型直接用于線上服務以及離線服務,然后每隔一段時間進行人工測試和抽檢模型,以確認是否能夠覆蓋全場景。
2)增量建模策略,是先給全場景下的每個子場景分別構建一個子場景數據集,然后將數據集合并建立一個模型,利用該模型對未標注的數據集進行預測,預測完之后讓人工審核和標注,這樣逐步發現該模型存在的不足,通過一次又一次的迭代完成新詞的補充。
但是,由于現在OTA(在線旅行社)行業的全場景語音識別存在子場景(例如酒店、旅游、機票等)業務復雜、數量繁多且存在中英文混合專業術語等的特點,利用上述兩種建模策略通過人工補充核心詞的方式更新語音識別模型會導致更新效率低下,進而影響語音識別的準確率。
發明內容
本發明要解決的技術問題是為了克服現有技術中通過人工補充核心詞存在模型更新效率低下進而影響語音識別準確率的缺陷,提供一種語音識別模型的訓練數據更新方法及系統、語音識別方法及系統、電子設備以及存儲介質。
本發明是通過下述技術方案來解決上述技術問題:
本發明的第一方面提供一種語音識別模型的訓練數據更新方法,包括以下步驟:
將目標場景下的目標音頻數據輸入第一語音識別模型,得到第一文本;
將所述目標音頻數據輸入第二語音識別模型,得到第二文本;
比較所述第一文本和所述第二文本,得到目標核心詞;其中,所述目標核心詞由所述第一語音識別模型識別得到;
根據所述目標核心詞在所述目標音頻數據中的目標位置,從包括所述目標位置以及所述目標位置附近的部分目標音頻數據中選取標注數據;其中,所述標注數據包括所述目標位置的音頻數據;
將所述標注數據以及對應的標注文本更新至所述第二語音識別模型的訓練數據中。
較佳地,所述訓練數據更新方法還包括:
選取目標場景下指定日期區間內的所有通話數據作為目標音頻數據。
較佳地,所述比較所述第一文本和所述第二文本,得到目標核心詞的步驟包括:
從所述第一文本的分詞結果中去除與所述第二文本的分詞結果相同的詞語,得到目標核心詞。
較佳地,所述第一文本包括若干與通話ID一一對應的轉寫文本;所述訓練數據更新方法還包括:
篩選包括所述目標核心詞的所有轉寫文本,并記錄對應的目標通話ID;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011073681.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





