[發明專利]模型的自訓練方法、裝置、計算機設備及存儲介質在審
| 申請號: | 201811605200.4 | 申請日: | 2018-12-26 |
| 公開(公告)號: | CN111435449A | 公開(公告)日: | 2020-07-21 |
| 發明(設計)人: | 熊友軍;羅沛鵬;廖洪濤 | 申請(專利權)人: | 深圳市優必選科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 深圳中細軟知識產權代理有限公司 44528 | 代理人: | 仉玉新 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種模型的自訓練方法,該方法包括:接收自定義的語料模板和實體;根據所述語料模板和實體生成訓練語料,所述訓練語料中包括訓練文本和對應的文本標注,所述訓練文本是根據所述語料模板和實體進行組合生成的;將所述訓練文本作為待訓練模型的輸入,將對應的文本標注作為所述待訓練模型的期望輸出對所述待訓練模型進行訓練,訓練完成得到目標模型。該模型的自訓練方法只需要用戶自定義語料模板和實體便可自動生成訓練語料,并自動根據訓練語料進行模型的訓練得到目標模型,簡單方便,實現了簡易、便捷、高效地識別機器語料。此外,還提出了一種模型的自訓練裝置、計算機設備及存儲介質。
技術領域
本發明涉及計算機處理領域,尤其是涉及一種模型的自訓練方法、裝置、計算機設備及存儲介質。
背景技術
隨著計算能力的提升和深度學習算法的廣泛應用,越來越多的問題能夠被深度學習解決。然而,深度學習技術具有一定的門檻,需要比較扎實的數學、編程基礎,當面對龐大的信息需求時,專業的深度學習者也難于支持。尤其,在機器學習中,因傳統的深度學習應用的門檻高,大多數人無法通過簡易便捷的方式解決機器人語料識別的問題,導致降低機器的分類或實體識別任務的效率。
發明內容
基于此,有必要針對上述問題,提供了一種能簡易、便捷、高效地識別機器語料的模型的自訓練方法、裝置、計算機設備及存儲介質。
第一方面,本發明實施例提供一種模型的自訓練方法,所述方法包括:
接收自定義的語料模板和實體;
根據所述語料模板和實體生成訓練語料,所述訓練語料中包括訓練文本和對應的文本標注,所述訓練文本是根據所述語料模板和實體進行組合生成的;
將所述訓練文本作為待訓練模型的輸入,將對應的文本標注作為所述待訓練模型的期望輸出對所述待訓練模型進行訓練,訓練完成得到目標模型。
在其中一個實施例中,當所述待訓練模型為意圖識別模型時,所述文本標注是根據所述語料模板的類型確定的;當所述待訓練模型為實體識別模型時,所述文本標注是根據所述訓練樣本中的實體的類型確定的。
在其中一個實施例中,在所述接收自定義的語料模板和實體之前,還包括:接收針對應用的模型訓練請求,根據所述訓練請求為所述應用的模型分配唯一的模型標識,所述模型標識用于區分不同應用的模型;所述接收自定義的語料模板和實體,包括:接收與所述模型標識對應的自定義語料模板和實體。
在其中一個實施例中,在所述根據所述語料模板和實體生成訓練語料之后,還包括:根據預設規則對所述訓練語料中的訓練文本進行檢查,所述預設規則包括是否存在重復配置的訓練文本、訓練文本的長度是否符合預設長度中的至少一種;當所述訓練文本不符合所述預設規則時,則生成提醒通知。
在其中一個實施例中,在所述根據所述語料模板和實體生成訓練語料之后,還包括:統計訓練服務器的剩余計算資源,當所述剩余計算資源大于預設資源閾值時,則將所述待訓練模型的訓練任務發送給所述訓練服務器;所述將所述訓練文本作為待訓練模型的輸入,將對應的文本標注作為所述待訓練模型的期望輸出對所述待訓練模型進行訓練,得到目標模型,包括:通過所述訓練服務器將所述訓練文本作為待訓練模型的輸入,將對應的文本標注作為所述待訓練模型的期望輸出對所述待訓練模型進行訓練,得到目標模型。
在其中一個實施例中,所述統計訓練服務器的剩余計算資源,包括:獲取影響所述訓練服務器剩余計算資源的指標,所述指標包括:內存的占用、CPU使用率、GPU使用率,GPU的顯存中的至少一種;獲取正在訓練的模型數量和所述訓練語料的大小;根據所述指標、所述正在訓練的模型數量和所述訓練語料的大小計算得到所述訓練服務器的剩余計算資源。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市優必選科技有限公司,未經深圳市優必選科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811605200.4/2.html,轉載請聲明來源鉆瓜專利網。





