[發明專利]基于InceptionV3網絡的被遮擋目標識別方法在審
| 申請號: | 201910451241.0 | 申請日: | 2019-05-28 |
| 公開(公告)號: | CN110222615A | 公開(公告)日: | 2019-09-10 |
| 發明(設計)人: | 于晟燾;劉坤 | 申請(專利權)人: | 上海海事大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/06 |
| 代理公司: | 上海互順專利代理事務所(普通合伙) 31332 | 代理人: | 成秋麗 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 遮擋 目標函數 艦船目標 清晰 網絡模型 遙感圖像 遮擋目標 連接層 魯棒性 約束項 映射 共享 引入 改進 網絡 學習 | ||
1.一種基于InceptionV3網絡的被遮擋目標識別方法,其特征在于包括以下步驟:
步驟一:建立InceptionV3-FC網絡結構;
對于InceptionV3-FC網絡模型,首先假設輸入的圖片尺寸為m×m×3,通過使用32個卷積核為3×3步長為2的卷積得到的特征圖,將得到特征圖送入卷積核為3×3步長為1的第二層卷積得到的特征圖,第三層卷積與第二層區別是該層有填充,得到的特征圖,之后通過池化層得到的特征圖,使用32個卷積核為3×3步長為2的卷積得到的特征圖,之后兩層卷積分別是使用80個卷積核為3×3步長為1以及192個3×3卷積核步長為2,最終得到的特征圖,將得到的特征圖作為輸入經過3個Inception模塊組;
第一個Inception模塊組包含了3個結構類似的Inception模塊,其中第一個Inception模塊有4個分支,第1個分支有64輸出通道的1×1卷積;第2個分支有48輸出通道的1×1卷積,連接有64輸出通道的5×5卷積;第3個分支有64輸出通道的1×1卷積,再連續連接2個96通道的3×3卷積;第4個分支是3×3的平均池化,連接有32輸出通道的1×1卷積。最后4個分支在輸出通道上合并,生成這個Inception模塊的最終輸出第二個Inception模塊與第一個Inception模塊唯一不同的是第4個分支連接為64輸出通道的1×1卷積,最終輸出第三個Inception模塊與第二個一樣;
第二個Inception模塊組包含了5個結構類似的Inception模塊,其中第一個Inception模塊有3個分支,第1個分支有384輸出通道的3×3卷積;第2個分支有三層,分別是一個64輸出通道的1×1卷積和兩個96輸出通道的3×3卷積;第3個分支是3×3的最大池化;最后3個分支在輸出通道上合并,生成這個Inception模塊的最終輸出第二個Inception模塊有4個分支,將4個分支合并后輸出后三個Inception模塊類似,能夠豐富卷積以及非線性化,對特征提煉;
第三個Inception模塊組包含了3個結構類似的Inception模塊,其中第一個Inception模塊有3個分支,第1個分支有192輸出通道的1×1卷積,連接有320輸出通道的3×3卷積;第2個分支有4個卷積層,分別是192輸出通道的1×1卷積、192輸出通道的1×7卷積、192輸出通道的7×1卷積,以及192輸出通道的3×3卷積;第3個分支是3×3的最大池化;最后3個分支在輸出通道上合并,生成這個Inception模塊的最終輸出第二個Inception模塊有4個分支,第一個分支為320通道的1×1卷積;第2個分支、第3個分支都為第4個分支在一個3×3的平均池化層后接一個192通道的1×1卷積;最后4個分支輸出通道合并,得到第三個Inception模塊與第二個Inception模塊一致,最后輸出為
最后將模塊組輸出的特征圖作為池化層的輸入,把空間信息轉化為高階的抽象特征信息,得到的特征圖,對高階抽象特征通過全局平均池化,變成線性的1×1×2048尺寸,線性層作為全連接層的輸入,通過特征約束,然后送入Softmax層完成分類預測;
步驟二:提出InceptionV3-FC目標函數;
對于給定的樣本,定義K個遮擋尺度及其遮擋變換其中表示遮擋程度為的樣本;對所有訓練樣本X={x1,x2,…,xN}應用遮擋變換可以得到一組新的訓練樣本其中單個遮擋樣本為清晰樣本和遮擋之后的總訓練樣本,即將共同用于訓練InceptionV3-FC模型;InceptionV3-FC模型除了要盡量減少訓練數據集上的錯誤識別意外,還要求對于任意訓練樣本都能夠識別;為此,提出一個新的目標函數:
L=Ls+λLc (1)
其中,λ為目標函數的權衡系數;Ls是Softmax交叉熵損失函數,為了將損失達到最小化,其表達式為:
其中,表示為樣本的真值標簽向量,N是X中初始訓練樣本的總數,K是每個xi∈X的遮擋變換總數,C表示總的類別;
Lc是目標函數特征變化約束項,主要對遮擋前后的訓練樣本施加,即X和以強制使它們共享相似的特征,則該約束項Lc定義為:
其中N是X中初始訓練樣本的總數,OFC(xi)是FC層的輸出,也是作為訓練樣本xi的InceptionV3-FC特征;表示遮擋的訓練樣本的平均InceptionV3-FC特征:
整理公式(1)~(3)得到最終的目標函數:
步驟三:訓練InceptionV3-FC模型;
InceptionV3-FC模型具體訓練步驟如下:
(1)完成網絡參數的初始化設置;
(2)將樣本按批次送入網絡,然后計算目標值與實際輸出偏差以及特征誤差,完成網絡的前向傳播;
(3)判斷偏差及特征誤差是否在容許的范圍內,通過Adam優化算法更新權值與偏差;
(4)重復2~3步操作,直至達到迭代次數;
(5)固定權值和閾值,保存網絡模型;
步驟四:測試InceptionV3-FC網絡;
對訓練好的網絡模型,將測試樣本作為輸入,得到輸出預測值,通過與樣本真實值進行比較,計算網絡的平均識別率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海海事大學,未經上海海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910451241.0/1.html,轉載請聲明來源鉆瓜專利網。





