[發明專利]一種基于GoogLeNet的紅外圖像識別方法有效
| 申請號: | 202011223719.3 | 申請日: | 2020-11-05 |
| 公開(公告)號: | CN112364979B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 張巖;李坡;武艷偉;劉光宏;李雨澤;叢明煜;于鯤;楊春玲;陳臻煒 | 申請(專利權)人: | 哈爾濱工業大學;中國電子科技集團公司信息科學研究院 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T5/00;G06T5/50;G06N3/04;G06N3/08;G06K9/62;G06V10/764;G06V10/82 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 劉景祥 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 googlenet 紅外 圖像 識別 方法 | ||
1.一種基于GoogLeNet的紅外圖像識別方法,其特征在于,所述紅外圖像識別方法包括以下步驟:
步驟一、數據增強:對紅外數據集進行數據增強,包括像素級調整、模擬對象遮擋以及多圖像拼接;
步驟二、改進GoogLeNet基本單元結構,搭建淺層Inception結構和深層Inception結構,其中,包含4層淺層Inception結構和4層深層Inception結構,
具體的,構建GoogLeNet基本單元Inception結構,分為淺層Inception和深層Inception,淺層Inception分成5個分支,分別為7*7卷積分支,5*5卷積分支,3*3卷積分支,池化分支,1*1卷積分支,并分別使用1*1卷積核進行參數降維,深層Inception結構使用3個1*3、3*1卷積組合替換7*7卷積核,2個1*3、3*1卷積組合替換5*5卷積核,1個1*3、3*1卷積組合替換3*3卷積核;
步驟三、引入空間注意力機制:使用空間注意力機制,犧牲少量的計算時間來提高模型的分類準確率,具體的,前一層Inception結構的輸出經過SAM分支得到權重參數,尺寸與輸入特征圖尺寸完全一樣,再與原圖相乘,將結果送到下一個Inception結構,從而得到淺層特征圖和深層特征圖;
步驟四、引入特征金字塔融合:將淺層特征圖和深層特征圖進行加權融合,提高網絡的識別精度和對于不同尺度目標的識別能力;
步驟五、引入Focal loss損失函數,并加入L1正則項:
loss=-ya(1-y')γlogy'-(1-y)(1-a)y'γlog(1-y')+λ(||W||2+||b||2)
式中y為標簽值,y'為預測值,a是平衡因子,用于平衡正負樣本本身的比例不均,γ負責控制難易樣本的權重,λ為正則化系數;
步驟六、引入Mish激活函數:使用Mish激活函數替換ReLU函數;
步驟七、使用遷移學習:使用ImageNet數據集對模型進行初始化,并將預訓練好的模型參數遷移到紅外數據集,進行參數微調;
步驟八、進行紅外圖像識別:使用微調后的網絡模型對紅外數據集進行識別,得到識別結果。
2.根據權利要求1所述的一種基于GoogLeNet的紅外圖像識別方法,其特征在于,在步驟一中,所述像素級調整包括光度畸變和幾何畸變,模擬對象遮擋分為像素級遮擋和區域級遮擋,多圖像拼接包括像素級拼接和區域級拼接。
3.根據權利要求2所述的一種基于GoogLeNet的紅外圖像識別方法,其特征在于,所述光度畸變包括調整圖像的亮度和加入噪聲;所述幾何畸變包括隨機縮放、剪切、翻轉和反旋轉;所述像素級遮擋,即隨機選擇圖像中的某一些點,填充一個隨機的或互補的零值;所述區域級遮擋,即隨機或均勻地選擇圖像中的多個矩陣區域,并將其全部替換為0;所述像素級拼接,即使用兩個圖像以不同的系數相乘并疊加,使用該系數值作為標簽;所述區域級拼接,即將剪切后的圖像覆蓋到其他圖像的矩陣區域,并根據混合區域的大小調整標簽。
4.根據權利要求1所述的一種基于GoogLeNet的紅外圖像識別方法,其特征在于,在步驟二中,引入7*7的卷積核分支,提高網絡的感受野大小,使用1*1卷積核進行參數降維,在網絡深層結構使用3*1和1*3的卷積組合替換3*3、5*5、7*7的卷積核。
5.根據權利要求1所述的一種基于GoogLeNet的紅外圖像識別方法,其特征在于,在步驟三中,前一層Inception結構的輸出分成兩條分支,一條經過兩次3×3的卷積操作后,使用Sigmoid激活函數映射到[0,1]區間得到注意力圖,另一條分支將Inception輸出直接與注意力圖進行相乘,得到下一層Inception的輸入。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學;中國電子科技集團公司信息科學研究院,未經哈爾濱工業大學;中國電子科技集團公司信息科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011223719.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種加密通信方法
- 下一篇:一種基于重力峰值相位差的紡織布料退漿盤
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





