[發明專利]一種基于GoogLeNet的紅外圖像識別方法有效
| 申請號: | 202011223719.3 | 申請日: | 2020-11-05 |
| 公開(公告)號: | CN112364979B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 張巖;李坡;武艷偉;劉光宏;李雨澤;叢明煜;于鯤;楊春玲;陳臻煒 | 申請(專利權)人: | 哈爾濱工業大學;中國電子科技集團公司信息科學研究院 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T5/00;G06T5/50;G06N3/04;G06N3/08;G06K9/62;G06V10/764;G06V10/82 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 劉景祥 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 googlenet 紅外 圖像 識別 方法 | ||
本發明公開了一種基于GoogLeNet的紅外圖像識別方法,屬于圖像識別技術領域。通過數據增強擴充訓練數據集,降低了對數據集大小的依賴。通過改進GoogLeNet的網絡結構提高模型對于尺度變化的魯棒性。將在ImageNet典型數據集上訓練好的GoogLeNet模型參數進行遷移學習,在紅外數據集上進行參數微調,提高訓練速度。本發明解決了目標尺度變化問題、樣本不均衡問題、訓練樣本不足的問題。同時提升了訓練的穩定性,有效提高了紅外圖像的識別準確率,提升了模型的泛化性和魯棒性。
技術領域
本發明涉及一種基于GoogLeNet的紅外圖像識別方法,屬于圖像識別技術領域。
背景技術
圖像識別,是指對圖像進行對象識別,以識別各種不同模式的目標和對象的技術。它涵蓋圖像匹配、圖像分類、圖像檢索、人臉檢測、行人檢測等技術,在互聯網搜索引擎、自動駕駛、醫學分析、遙感分析等領域具有廣泛的應用價值。
現有的圖像識別技術主要分為基于特征提取的傳統算法和基于卷積神經網絡的深度學習算法。傳統的特征提取算法針對不同應用場景難以選取穩定有效的特征。基于卷積神經網絡的圖像識別算法對訓練集的大小要求嚴格,難以應對紅外場景中數據缺乏的問題。此外,這種卷積神經網絡不具備尺度不變性,一定程度上限制了圖像識別技術的進一步發展。本發明使用遷移學習的方法,通過改進GoogLeNet的網絡結構,解決尺度變化和訓練集缺乏的問題。
發明內容
本發明的目的是提出一種基于GoogLeNet的紅外圖像識別方法,使用遷移學習的方法,通過改進GoogLeNet的網絡結構,以解決尺度變化和訓練集缺乏的問題。
一種基于GoogLeNet的紅外圖像識別方法,所述紅外圖像識別方法包括以下步驟:
步驟一、數據增強:對紅外數據集進行數據增強,包括像素級調整、模擬對象遮擋以及多圖像拼接;
步驟二、改進GoogLeNet基本單元結構,搭建淺層Inception結構和深層Inception結構;
步驟三、引入空間注意力機制:使用空間注意力機制,犧牲少量的計算時間來提高模型的分類準確率;
步驟四、引入特征金字塔融合:將淺層特征圖和深層特征圖進行加權融合,提高網絡的識別精度和對于不同尺度目標的識別能力;
步驟五、引入Focal loss損失函數,并加入L1正則項:
loss=-ya(1-y')γlogy'-(1-y)(1-a)y'γlog(1-y')+λ(||W||+||b||)
式中y為標簽值,y'為預測值,a是平衡因子,用于平衡正負樣本本身的比例不均,γ負責控制難易樣本的權重,λ為正則化系數;
步驟六、引入Mish激活函數:使用Mish激活函數替換ReLU函數;
步驟七、使用遷移學習:使用ImageNet數據集對模型進行初始化,并將預訓練好的模型參數遷移到紅外數據集,進行參數微調;
步驟八、進行紅外圖像識別:使用微調后的網絡模型對紅外數據集進行識別,得到識別結果。
進一步的,在步驟一中,所述像素級調整包括光度畸變和幾何畸變,模擬對象遮擋分為像素級遮擋和區域級遮擋,多圖像拼接包括像素級拼接和區域級拼接。
進一步的,所述光度畸變包括調整圖像的亮度和加入噪聲;所述幾何畸變包括隨機縮放、剪切、翻轉和反旋轉;所述像素級遮擋,即隨機選擇圖像中的某一些點,填充一個隨機的或互補的零值;所述區域級遮擋,即隨機或均勻地選擇圖像中的多個矩陣區域,并將其全部替換為0;所述像素級拼接,即使用兩個圖像以不同的系數相乘并疊加,使用該系數值作為標簽;所述區域級拼接,即將剪切后的圖像覆蓋到其他圖像的矩陣區域,并根據混合區域的大小調整標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學;中國電子科技集團公司信息科學研究院,未經哈爾濱工業大學;中國電子科技集團公司信息科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011223719.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種加密通信方法
- 下一篇:一種基于重力峰值相位差的紡織布料退漿盤
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





