[發(fā)明專利]基于自蒸餾的圖像分類方法、系統(tǒng)、存儲介質(zhì)和電子設(shè)備有效
| 申請?zhí)枺?/td> | 202310071832.1 | 申請日: | 2023-01-13 |
| 公開(公告)號: | CN116416456B | 公開(公告)日: | 2023-10-24 |
| 發(fā)明(設(shè)計)人: | 程彥皓 | 申請(專利權(quán))人: | 北京數(shù)美時代科技有限公司;數(shù)美天下(北京)科技有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06N3/0464;G06N3/045;G06N3/096 |
| 代理公司: | 北京輕創(chuàng)知識產(chǎn)權(quán)代理有限公司 11212 | 代理人: | 厲洋洋 |
| 地址: | 100012 北京市朝陽區(qū)來廣營西路*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 蒸餾 圖像 分類 方法 系統(tǒng) 存儲 介質(zhì) 電子設(shè)備 | ||
本發(fā)明公開了一種基于自蒸餾的圖像分類方法、系統(tǒng)、存儲介質(zhì)和電子設(shè)備,包括:基于多個圖像樣本,對卷積神經(jīng)網(wǎng)絡(luò)進行迭代訓(xùn)練,得到第一圖像分類模型;將每個圖像樣本輸入第一圖像分類模型,得到并將輸出特征圖分別輸入特征處理模塊和注意力機制模塊,得到并根據(jù)原始特征圖和注意力特征圖進行自蒸餾,得到并根據(jù)每個圖像樣本的自蒸餾損失值,對第一圖像分類模型的參數(shù)進行優(yōu)化,直至第二圖像分類模型滿足預(yù)設(shè)條件時,將第二圖像分類模型確定為目標圖像分類模型;將待測圖像輸入至目標圖像分類模型,得到圖像分類結(jié)果。本發(fā)明能夠利用模型自身的注意力圖進行蒸餾,在有效壓縮圖像分類模型訓(xùn)練時間的同時,確保了圖像分類的效果不受影響。
背景技術(shù)
知識蒸餾是將知識從預(yù)先訓(xùn)練的較大的教師網(wǎng)絡(luò)轉(zhuǎn)移到學(xué)生網(wǎng)絡(luò)的方法,使得較小的學(xué)生網(wǎng)絡(luò)獲得與教師網(wǎng)絡(luò)相近的識別效果,同時降低部署時的計算復(fù)雜度。但現(xiàn)有的知識蒸餾方法,首先要訓(xùn)練較大的教師網(wǎng)絡(luò),待教師網(wǎng)絡(luò)訓(xùn)練完成后,利用教師網(wǎng)絡(luò)訓(xùn)練學(xué)生網(wǎng)絡(luò),這種方法雖然還可以有效提升學(xué)生網(wǎng)絡(luò)的效果,但訓(xùn)練周期較長,難以維護。
因此,如何在不損失學(xué)生網(wǎng)絡(luò)的效果的基礎(chǔ)上,有效節(jié)省訓(xùn)練時間,是當前亟需解決的技術(shù)問題。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明提供了一種基于自蒸餾的圖像分類方法、系統(tǒng)、存儲介質(zhì)和電子設(shè)備。
本發(fā)明的基于自蒸餾的圖像分類方法的技術(shù)方案如下:
基于多個圖像樣本,對用于圖像分類的卷積神經(jīng)網(wǎng)絡(luò)進行迭代訓(xùn)練,得到第一圖像分類模型;
將任一圖像樣本輸入所述第一圖像分類模型,得到該圖像樣本對應(yīng)的輸出特征圖,并將所述輸出特征圖輸入至特征處理模塊,得到該圖像樣本的原始特征圖,將所述輸出特征圖輸入至注意力機制模塊,得到該圖像樣本的注意力特征圖,并基于該圖像樣本的原始特征圖和注意力特征圖進行自蒸餾,得到該圖像樣本的自蒸餾損失值,直至得到每個圖像樣本的自蒸餾損失值;
基于所有的自蒸餾損失值,對所述第一圖像分類模型的參數(shù)進行優(yōu)化,得到第二圖像分類模型,將所述第二圖像分類模型作為所述第一圖像分類模型并返回執(zhí)行所述將任一圖像樣本輸入所述第一圖像分類模型的步驟,直至所述第二圖像分類模型滿足預(yù)設(shè)訓(xùn)練條件時,將所述第二圖像分類模型確定為目標圖像分類模型;
將待測圖像輸入至所述目標圖像分類模型,得到所述待測圖像的圖像分類結(jié)果。
本發(fā)明的基于自蒸餾的圖像分類方法的有益效果如下:
本發(fā)明的方法不需要單獨訓(xùn)練教師網(wǎng)絡(luò),能夠利用模型自身的注意力圖進行蒸餾,在有效壓縮圖像分類模型訓(xùn)練時間的同時,確保了圖像分類的效果不受影響。
在上述方案的基礎(chǔ)上,本發(fā)明的基于自蒸餾的圖像分類方法還可以做如下改進。
進一步,所述特征處理模塊包括:依次連接設(shè)置的通道維度的第一平均池化層和第一L2歸一化層;
所述將所述輸出特征圖輸入至特征處理模塊,得到該圖像樣本的原始特征圖的步驟,包括:
將所述輸出特征圖依次通過所述通道維度的第一平均池化層和所述第一L2歸一化層進行通道維度平均池化處理和L2歸一化處理,得到該圖像樣本的原始特征圖。
進一步,所述注意力機制模塊包括:全局平均池化層、節(jié)點權(quán)重計算模塊、通道維度的第二平均池化層和第二L2歸一化層;
所述將所述輸出特征圖輸入至注意力機制模塊,得到該圖像樣本的注意力特征圖的步驟,包括:
將所述輸出特征圖輸入至所述所述全局平均池化層進行全局平均池化處理,得到第一特征圖;
通過所述節(jié)點權(quán)重計算模塊獲取所述第一特征圖的正確預(yù)測節(jié)點所對應(yīng)的權(quán)重,并將所述第一特征圖的正確預(yù)測節(jié)點所對應(yīng)的權(quán)重與所述輸出特征圖相乘,得到第二特征圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京數(shù)美時代科技有限公司;數(shù)美天下(北京)科技有限公司,未經(jīng)北京數(shù)美時代科技有限公司;數(shù)美天下(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310071832.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:多平面放置的沙畫彩砂盒
- 下一篇:一種激光復(fù)合焊接方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





