[發明專利]一種基于語義識別的訓練方法、訓練裝置及終端設備在審
| 申請號: | 201811565995.0 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN111354354A | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 熊友軍;羅沛鵬;廖洪濤 | 申請(專利權)人: | 深圳市優必選科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18;G10L15/06 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 張全文 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 識別 訓練 方法 裝置 終端設備 | ||
本發明適用于語義識別技術領域,提供了一種語義識別的訓練方法、訓練裝置及終端設備,所述訓練方法包括:對預設的操作指令語料進行預處理,獲取基于第一操作指令文本的訓練集;對經過預處理的操作指令語料進行一級訓練,獲取基于操作指令語料的中間向量模型;建立所述中間向量模型與所述訓練集的映射關系;根據所述映射關系,對與所述訓練集對應的中間向量模型進行二級訓練,獲取基于操作指令意圖的預測模型;通過深度學習對操作指令意圖的獲取進行訓練,可以獲取不同操作指令之間特征,使得執行操作指令的終端設備更容易理解操作指令意圖,擴大了終端設備對操作指令識別的范圍,提高了對操作指令的處理效率以及準確度。
技術領域
本發明屬于語義識別技術領域,尤其涉及一種語義識別的訓練方法、訓練裝置及終端設備。
背景技術
隨著語音識別技術的發展,與各種智能終端設備進行語音交互應用在越來越多的場景;例如,通過與機器人的語音交互,傳遞給機器人操作指令,控制機器人執行相應的操作。
目前,對語音識別后,得到對應的文本,需要在智能終端設備配置大量的相關的操作指令,對語音識別后的文本通過關鍵詞或采用正則表達式進行匹配,獲取與語音對應的操作指令;但對于比較口語化的語音,與預設的操作指令庫存在文字的差別或文字順序不一樣導致匹配失敗,或者需要列舉出更多的操作指令,不僅工作量大,在操作指令過多時,使得語音交互效率很低。
發明內容
有鑒于此,本發明實施例提供了一種基于語義識別的訓練方法、訓練裝置及終端設備,以解決現有技術中語音匹配受操作指令庫的限制以及操作指令過多時語音交互效率很低的問題。
本發明實施例的第一方面提供了一種基于語義識別的訓練方法,包括:
對預設的操作指令語料進行預處理,獲取基于第一操作指令文本的訓練集;
對經過預處理的操作指令語料進行一級訓練,獲取基于操作指令語料的中間向量模型;
建立所述中間向量模型與所述訓練集的映射關系;
根據所述映射關系,對與所述訓練集對應的中間向量模型進行二級訓練,獲取基于操作指令意圖的預測模型。
在一個實施例中,對預設的操作指令語料進行預處理,獲取基于第一操作指令文本的訓練集,包括:
對所述操作指令語料進行格式化處理以及語義聯想擴展;
對經過格式化處理以及擴展的操作指令語料重采樣,獲取數量平衡、多種類型的操作指令語料樣本;
根據操作指令意圖對所述操作指令語料樣本進行分類標識,獲取基于所述第一操作指令文本的訓練集。
在一個實施例中,對經過預處理的操作指令語料進行一級訓練,獲取基于操作指令語料的中間向量模型,包括:
采用第一訓練模型將所述操作指令語料訓練成字向量;
采用第二訓練模型對所述字向量進行公開語料訓練,獲取字向量模型。
在一個實施例中,建立所述中間向量模型與所述訓練集的映射關系,包括:
根據所述中間向量模型,獲取所述訓練集的所述第一操作指令文本中每個字對應的字向量;
將與每個字相關聯的字向量組成矩陣,獲取與每個字對應的句向量。
在一個實施例中,根據所述映射關系,對與所述訓練集對應的中間向量模型進行二級訓練,獲取基于操作指令意圖的預測模型,包括:
按預設比例抽取每一類的操作指令語料,作為操作指令樣本;
通過神經網絡分類模型對所述操作指令樣本進行訓練,獲取基于操作指令意圖的預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市優必選科技有限公司,未經深圳市優必選科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811565995.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻播放方法及計算設備
- 下一篇:活塞缸及車輛





