[發明專利]一種語音識別模型訓練方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011053173.1 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112185361A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 張曉明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/16;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 劉星雨;張穎玲 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 模型 訓練 方法 裝置 電子設備 存儲 介質 | ||
本發明提供了一種語音識別模型訓練方法裝置、電子設備及存儲介質,方法包括:基于文本的目標類型對所述待識別音頻信息對應的標注文本信息進行預處理;在第一發音詞典中添加所述目標類型的文本信息對應的發音,形成第二發音詞典;基于所述第二發音詞典,生成與所述待識別音頻信息對應的標注文本信息相匹配的發音序列;確定訓練樣本集合;確定所述語音神經網絡的模型參數,由此,可以通過云技術將廣域網或局域網內將硬件、軟件及網絡等系列資源統一起來,能夠自動化的形成相應的發音序列,形成訓練樣本集合對語音識別模型進行訓練,減少由于錯誤的發音或者遺漏發音信息,影響語音識別模型訓練的準確性。
技術領域
本發明涉及機器學習技術,尤其涉及一種語音識別模型訓練方法、裝置、電子設備及存儲介質。
背景技術
隨著機器學習技術的發展,機器學習可以通過相應的語音識別模型機制實現,并且可以結合云技術實現,云技術是指在廣域網或局域網內將硬件、軟件及網絡等系列資源統一起來,實現數據的計算、儲存、處理和共享的一種托管技術,也可理解為基于云計算商業模式應用的網絡技術、信息技術、整合技術、管理平臺技術及應用技術等的總稱。技術網絡系統的后臺服務需要大量的計算、存儲資源,如視頻網站、圖片類網站和更多的門戶網站,因此云技術需要以云計算作為支撐。
需要說明的是,云計算是一種計算模式,它將計算任務分布在大量計算機構成的資源池上,使各種應用系統能夠根據需要獲取計算力、存儲空間和信息服務。提供資源的網絡被稱為“云”。“云”中的資源在使用者看來是可以無限擴展的,并且可以隨時獲取,按需使用,隨時擴展,按使用付費。作為云計算的基礎能力提供商,會建立云計算資源池平臺,簡稱云平臺,一般稱為基礎設施即服務(IaaS,Infrastructure as a Service),在資源池中部署多種類型的虛擬資源,供外部客戶選擇使用。云計算資源池中主要包括:計算設備(可為虛擬化機器,包含操作系統)、存儲設備和網絡設備。但是,在使用神經網絡模型對應的模型對語音數據進行處理的過程中,對于數字類語音信息場景的指令識別中,由于用戶語句的發音多種多樣較為復雜,交互成功率較低,影響用戶的使用體驗。因此,在特定目標類型場景下對用戶意圖識別精度要求更高,智能設備需要懂得如何準確地響應用戶的語音指令語句。
發明內容
有鑒于此,本發明實施例提供一種語音識別模型訓練方法、裝置、電子設備及存儲介質,能夠利用待識別音頻信息對應的標注文本信息,自動化的形成相應的發音序列,并基于待識別音頻信息對應的標注文本信息,以及與所述標注文本信息相匹配的發音序列,形成訓練樣本集合對語音識別模型進行訓練,減少由于錯誤的發音或者遺漏發音信息,影響語音識別模型訓練的準確性。
本發明實施例的技術方案是這樣實現的:
本發明實施例提供了一種語音識別模型訓練方法,所述方法包括:
獲取待識別音頻信息對應的標注文本信息,并基于文本的目標類型對所述待識別音頻信息對應的標注文本信息進行預處理;
遍歷經過預處理的標注文本信息,確定相應目標類型的文本信息;
基于所述目標類型的文本信息,在第一發音詞典中添加所述目標類型的文本信息對應的發音,形成第二發音詞典;
基于所述第二發音詞典,生成與所述待識別音頻信息對應的標注文本信息相匹配的發音序列;
根據所述待識別音頻信息對應的標注文本信息,以及與所述標注文本信息相匹配的發音序列,確定訓練樣本集合;
通過所述訓練樣本集合對所述語音識別模型中的聲學神經網絡進行訓練,以確定所述聲學神經網絡的模型參數;
通過所述訓練樣本集合對所述語音識別模型中的語言神經網絡進行訓練,以確定所述語音神經網絡的模型參數,以實現通過所述語音識別模型對使用環境中的不同語音信息進行處理。
本發明實施例還提供了一種語音識別模型的訓練裝置,所述訓練裝置包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011053173.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高效的水地源熱泵機器
- 下一篇:硅基負極材料及其制備方法和應用





