[發明專利]基于類別級軟目標監督的細粒度圖像分類模型訓練方法在審
| 申請號: | 202310352190.2 | 申請日: | 2023-04-04 |
| 公開(公告)號: | CN116563602A | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 梅建萍;褚鑫凱 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/74;G06V10/40;G06N3/098 |
| 代理公司: | 杭州賽科專利代理事務所(普通合伙) 33230 | 代理人: | 余華康 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 類別 目標 監督 細粒度 圖像 分類 模型 訓練 方法 | ||
1.一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:所述方法以有標簽的數據預訓練一目標模型;以目標模型的參數初始化EMA模型,根據EMA模型中全連接層的參數計算一相似度矩陣,基于相似度矩陣獲得類別級軟標簽tCla,與圖像進行關聯;
輸入圖像,基于目標模型和EMA模型構建模型訓練的總損失更新目標模型;以新的目標模型更新EMA模型,并用新EMA模型計算出新的類別級軟標簽;重復并最小化總損失,實現細粒度圖像分類模型的訓練。
2.根據權利要求1所述的一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:所述目標函數為,
gc=f(xc;φ)
其中,f表示目標模型,C表示類別總量,c對應每個類別,yc是樣本xc的標簽,pc是經過歸一化處理后模型預測的到第c個類別的概率,T是溫度系數,0T5,gc是樣本xc經過目標模型f后得到的歸一化之前的輸出,φ是目標模型的參數。
3.根據權利要求1所述的一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:所述目標模型包括特征提取器和分類器,目標模型的特征提取器和分類器在每一輪基于總損失的梯度反傳進行更新;所述EMA模型包括特征提取器和分類器,EMA模型的特征提取器和分類器初始化為目標模型中的特征提取器和分類器,訓練過程中EMA模型的特征提取器和分類器基于當前目標模型通過指數滑動平均進行更新。
4.根據權利要求1所述的一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:EMA模型的分類器的全連接層VK×C包括每個類別的權重,K為維度,得到一個相似度矩陣S,
S=VTV,對S的每一列歸一化處理,得到類別級軟標簽tcla。
5.根據權利要求1所述的一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:輸入圖像,基于目標模型和EMA模型構建模型訓練的總損失L包括:
基于目標模型預測的概率分布,計算其與樣本真實硬標簽之間的交叉熵損失LHard;
基于目標模型預測的概率分布,計算其與類別級軟標簽之間的KL散度LCla;
基于目標模型預測的概率分布,計算其與EMA模型輸出概率分布之間的KL散度LEMA。
6.根據權利要求5所述的一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:L=LHard+λ1LCla+λ2LEMA,其中,λ1和λ2為對應損失的權重系數,λ10,λ20。
7.根據權利要求5所述的一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:KL散度LCla滿足,
LCla=KL(tCla,p)
其中,KL散度為KL(t,p),C表示類別總量,c對應每個類別,tCla為類級別的軟標簽,p是經過歸一化處理后模型預測的概率分布。
8.根據權利要求5所述的一種基于類別級軟目標監督的細粒度圖像分類模型訓練方法,其特征在于:KL散度LeMA滿足,
LeMA=KL(teMA,p)
其中,KL()為KL散度,tEMA為樣本經過EMA模型得到的輸出,p是樣本經過目標模型得到的概率分布。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310352190.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種輪胎內壁清洗機
- 下一篇:一種多源數據融合語音室內定位方法及相關設備





