[發明專利]模型訓練的方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110777357.0 | 申請日: | 2021-07-09 |
| 公開(公告)號: | CN113516185A | 公開(公告)日: | 2021-10-19 |
| 發明(設計)人: | 戴兵 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/55;G06N3/04;G06N3/08 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 孫翠賢;馬敬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 電子設備 存儲 介質 | ||
1.一種模型訓練的方法,包括:
獲取目標樣本集;其中,所述目標樣本集包括原始樣本集中屬于原始類別的部分樣本對象,以及新增樣本集中屬于新增類別的樣本對象,所述原始樣本集為預先訓練完成的原始分類模型所利用的樣本集;
基于所述原始分類模型對應的原始信息,采用所述目標樣本集對待訓練的目標分類模型進行訓練,得到訓練完成的所述目標分類模型;
其中,所述目標分類模型用于推理的各類別包括所述原始類別和所述新增類別;所述原始分類模型對應的原始信息包括:針對所述目標樣本集中每個樣本對象,利用所述原始分類模型進行分類時所得到的分類結果。
2.根據權利要求1所述的方法,其中,所述基于所述原始分類模型對應的原始信息,采用所述目標樣本集對待訓練的目標分類模型進行訓練,包括:
從所述目標樣本集中獲取樣本對象,作為目標樣本對象;
將所述目標樣本對象輸入所述目標分類模型,得到第一分類結果,并將所述目標樣本對象輸入所述原始分類模型,得到第二分類結果;
利用所述第一分類結果中針對所述原始類別的結果與所述第二分類結果的差異,確定所述目標分類模型的損失,作為所述目標分類模型的結果損失;
基于所述結果損失,調整所述目標分類模型的參數,并在所述目標樣本集中樣本對象均被利用之前,返回執行所述從所述目標樣本集中獲取樣本對象,作為目標樣本對象的步驟,繼續對所述目標分類模型進行訓練。
3.根據權利要求2所述的方法,其中,所述基于所述結果損失,調整所述目標分類模型的參數,包括:
對所述結果損失和所述目標樣本對象對應的分類損失進行加權,得到所述分類模型的模型損失;其中,所述分類損失為基于所述第一分類結果與所述目標樣本對象的類別標定結果的差異所確定的損失;
基于所述模型損失,按照預定參數調整方式,調整所述目標分類模型的參數。
4.根據權利要求3所述的方法,其中,所述目標分類模型與所述原始分類模型的指定網絡層的參數相同,所述指定網絡層為除用于輸出分類類別的全連接層外的網絡層;
所述基于所述模型損失,按照預定參數調整方式,調整所述目標分類模型的參數,包括:
基于所述模型損失,調整所述目標分類模型的全連接層中的參數。
5.根據權利要求2所述的方法,其中,所述利用所述第一分類結果中針對所述原始類別的結果與所述第二分類結果的差異,確定所述目標分類模型的損失,作為所述目標分類模型的結果損失,包括:
計算所述第一分類結果中針對各個原始類別的結果與對應的第二分類結果的差值,并將計算得到的差值之和作為所述目標分類模型的結果損失;或者,
計算所述第一分類結果中針對所述原始類別的結果和所述第二分類結果之間的散度,作為所述目標分類模型的結果損失。
6.根據權利要求5所述的方法,其中,所述計算所述第一分類結果中針對所述原始類別的結果和所述第二分類結果之間的散度,作為所述目標分類模型的結果損失,包括:
計算所述第一分類結果中針對所述原始類別的結果和所述第二分類結果之間的詹森-香農JS散度,作為所述目標分類模型的結果損失。
7.根據權利要求2所述的方法,其中,在所述基于所述結果損失,調整所述目標分類模型的參數之后,還包括:
若所述目標樣本對象為屬于所述原始類別的樣本對象,則返回執行所述從所述目標樣本集中獲取樣本對象,作為目標樣本對象的步驟;
若所述目標樣本對象為屬于所述新增類別的樣本對象,則確定所述目標樣本對象已利用次數是否小于預設閾值;若不小于,則返回執行所述從所述目標樣本集中獲取樣本對象,作為目標樣本對象的步驟,否則,執行所述將所述目標樣本對象輸入所述目標分類模型,得到第一分類結果的步驟,直至所述已利用次數不小于所述預設閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110777357.0/1.html,轉載請聲明來源鉆瓜專利網。





