[發明專利]基于深度學習的SAR圖像艦船目標檢測識別一體化方法在審
| 申請號: | 202010118621.5 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN111368671A | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 曹宗杰;候澤生;崔宗勇;楊建宇 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06N3/04 |
| 代理公司: | 成都點睛專利代理事務所(普通合伙) 51232 | 代理人: | 孫一峰 |
| 地址: | 611731 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 sar 圖像 艦船 目標 檢測 識別 一體化 方法 | ||
1.基于深度學習的SAR圖像艦船目標檢測識別一體化方法,其特征在于,包括以下步驟:
S1、制作訓練數據集:選擇具有多類艦船的SAR圖像,將其制作成統一大小的SAR圖像切片,對切片進行標記,即在切片上用矩形框畫出艦船目標的具體位置,并且進行類別的標記,獲得訓練數據集;
S2、構建深度神經網絡:以RetinaNet網絡作為網絡框架,構建的深度神經網絡包括ResNet50、特征金字塔網絡FPN、分類和回歸子網絡;
ResNet50作為基礎網絡,SAR圖像首先經過ResNet50的卷積層1,進行1次7×7卷積和1次最大池化運算;然后進入卷積層2,卷積層2的結構依次包括1×1卷積、3×3卷積、1×1卷積和ReLU激活函數,還包括直連通道將卷積層2的輸入直接連接到ReLU激活函數;ResNet50卷積層3、卷積層4和卷積層5的結構和卷積核同卷積層2,只是在每層輸出通道數有所不同,卷積層2輸出通道數為256,卷積層3輸出通道數為512,卷積層4輸出通道數為1024,卷積層5輸出通道數為2048;
RetinaNet使用FPN中的第三至第七層,其中第三至第五層是從基礎網絡中的卷積層3至卷積層5采用自頂向下和橫向連接輸出的,第六層是通過卷積層5上的3×3卷積獲得,第七層是先在第六層上應用ReLU激活函數,然后在第六層上應用3×3卷積獲得;在金字塔的第三至第七層中,錨點的面積分別為32×32,64×64,128×128,256×256,512×512,每個金字塔層錨點有3個長寬對比度1:2,1:1,2:1,整個特征金字塔有15種錨點;如果某個錨點和一個給定的目標真值有最高的交并比或者和任意一個目標真值的交并比都大于0.7,則是正樣本,如果一個錨點和任意一個目標真值的交并比都小于0.3,則為負樣本,交并比IOU計算公式如下:
其中area(C)是預測的候選框,area(G)是原目標真值標記框;
分類子網絡和回歸子網絡均由4個3×3卷積層構成,在分類子網絡的第二層末端加入壓縮和激勵模塊,壓縮和激勵模塊的輸出特征信息傳遞給分類子網絡的卷積層3,子網絡卷積層4輸出的結果用于預測結果;
分類和回歸子網絡的損失函數由分類和回歸兩部分組成,分類采用的損失函數如下:
Lossc=-αt(1-pt)γlog(pt)
其中,pt表示損失概率,γ稱為聚焦參數,γ=2,αt是權重因數,αt=0.25;
回歸任務中的損失函數采用Smooth L1:
其中x代表預測框與真實目標之間的差異;
則檢測識別一體化總的目標是損失函數:
Loss=Lossc+Lossr
S3、利用步驟S1的訓練數據集對步驟S2構建的深度神經網絡進行訓練,獲得訓練好的深度神經網絡;
S4、通過SAR回波獲得艦船圖像后,將其輸入訓練好的深度神經網絡,獲得檢測識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010118621.5/1.html,轉載請聲明來源鉆瓜專利網。





