[發明專利]一種增量學習方法、裝置及設備有效
| 申請號: | 202111028310.0 | 申請日: | 2021-09-02 |
| 公開(公告)號: | CN113850302B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 葉帆帆;馬良;鐘巧勇;謝迪;浦世亮 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/241;G06N3/04 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 楊春香 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 增量 學習方法 裝置 設備 | ||
1.一種增量學習方法,其特征在于,所述方法包括:
獲取目標生成器、原始任務模型和初始增量模型;所述原始任務模型基于原始數據訓練得到,所述初始增量模型的網絡結構與所述原始任務模型的網絡結構相同,且所述初始增量模型的參數值與所述原始任務模型的參數值不同;
將混合數據輸入給所述原始任務模型得到第一特征向量,將所述混合數據輸入給所述初始增量模型得到第二特征向量;其中,所述混合數據包括所述目標生成器生成的虛擬數據、用于對初始增量模型進行增量學習的增量數據;其中,所述目標生成器生成虛擬數據的過程,包括:將固定維度的隨機噪聲向量輸出給所述目標生成器,以使所述目標生成器對所述隨機噪聲向量進行上采樣,得到指定分辨率的虛擬數據;其中,所述虛擬數據包括RGB圖像;
基于所述第一特征向量和所述第二特征向量對所述初始增量模型的參數值進行調整,得到調整后增量模型;
若所述調整后增量模型未收斂,則將所述調整后增量模型確定為初始增量模型,返回執行將混合數據輸入給所述原始任務模型得到第一特征向量的操作;
若所述調整后增量模型已收斂,則將所述調整后增量模型確定為已完成增量學習的目標增量模型,所述目標增量模型用于對待檢測數據進行處理。
2.根據權利要求1所述的方法,其特征在于,
所述基于所述第一特征向量和所述第二特征向量對所述初始增量模型的參數值進行調整,得到調整后增量模型,包括:
基于所述第一特征向量和所述第二特征向量確定第一目標損失值;
基于所述第一目標損失值對所述初始增量模型的參數值進行調整,得到所述調整后增量模型。
3.根據權利要求2所述的方法,其特征在于,
所述基于所述第一特征向量和所述第二特征向量確定第一目標損失值,包括:基于特征差異化損失值確定所述第一目標損失值;或者,基于特征差異化損失值和類別交叉熵損失值確定所述第一目標損失值;其中:
所述特征差異化損失值的確定方式包括:確定所述第一特征向量與所述第二特征向量之間的距離,基于所述距離確定所述特征差異化損失值。
4.根據權利要求3所述的方法,其特征在于,
所述類別交叉熵損失值的確定方式包括:將混合數據輸入給所述原始任務模型得到K個類別分別對應的置信度,K為大于1的正整數;
從所有置信度中選取最大置信度,將最大置信度對應的類別確定為所述第一特征向量的偽標簽,并將最大置信度確定為所述偽標簽的目標置信度;
基于所述偽標簽的目標置信度確定所述類別交叉熵損失值。
5.根據權利要求1所述的方法,其特征在于,所述獲取目標生成器包括:
基于初始生成器生成模擬數據,將所述模擬數據輸入給原始任務模型得到第三特征向量,并將所述模擬數據輸入給初始隨機模型得到第四特征向量;其中,所述初始隨機模型的網絡結構與所述原始任務模型的網絡結構相同,且所述初始隨機模型的參數值與所述原始任務模型的參數值不同;
基于所述第三特征向量和所述第四特征向量對所述初始生成器的參數值進行調整,得到調整后生成器,并基于所述第三特征向量和所述第四特征向量對所述初始隨機模型的參數值進行調整,得到調整后隨機模型;
若調整后生成器未收斂,則將調整后生成器確定為初始生成器,將調整后隨機模型確定為初始隨機模型,返回執行基于初始生成器生成模擬數據的操作;
若調整后生成器已收斂,則將所述調整后生成器確定為已完成訓練的目標生成器,所述目標生成器用于保持目標增量模型在原始數據的性能。
6.根據權利要求5所述的方法,其特征在于,
所述基于所述第三特征向量和所述第四特征向量對所述初始生成器的參數值進行調整,得到調整后生成器,并基于所述第三特征向量和所述第四特征向量對所述初始隨機模型的參數值進行調整,得到調整后隨機模型,包括:
基于所述第三特征向量和所述第四特征向量確定第二目標損失值;
基于所述第二目標損失值對所述初始生成器的參數值進行調整,得到所述調整后生成器,并基于所述第二目標損失值對所述初始隨機模型的參數值進行調整,得到所述調整后隨機模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111028310.0/1.html,轉載請聲明來源鉆瓜專利網。





