[發(fā)明專(zhuān)利]基于多層級(jí)特征選擇卷積神經(jīng)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110090408.2 | 申請(qǐng)日: | 2021-01-22 |
| 公開(kāi)(公告)號(hào): | CN112766184A | 公開(kāi)(公告)日: | 2021-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 蔣晨;郭成昊;夏思宇;羅子娟;李友江 | 申請(qǐng)(專(zhuān)利權(quán))人: | 東南大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯(lián)專(zhuān)利代理有限公司 32206 | 代理人: | 許小莉 |
| 地址: | 210096 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 多層 特征 選擇 卷積 神經(jīng)網(wǎng)絡(luò) 遙感 目標(biāo) 檢測(cè) 方法 | ||
1.一種基于多層級(jí)特征選擇卷積神經(jīng)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)方法,其特征在于:該方法包括以下步驟:
(1)搭建卷積神經(jīng)網(wǎng)絡(luò)模型,并對(duì)搭建的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)進(jìn)行設(shè)定和訓(xùn)練參數(shù)初始化;
(2)對(duì)訓(xùn)練圖像進(jìn)行預(yù)處理和標(biāo)簽格式轉(zhuǎn)化,然后預(yù)處理和標(biāo)簽格式轉(zhuǎn)化的訓(xùn)練圖像進(jìn)行數(shù)據(jù)增強(qiáng);
(3)用步驟(2)中得到的數(shù)據(jù)進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,得到網(wǎng)絡(luò)權(quán)重和偏置;
(4)將測(cè)試圖像輸入步驟(3)中訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,得到定位和分類(lèi)結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于多層級(jí)特征選擇卷積神經(jīng)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)方法,其特征在于:在步驟(1)中,所述搭建卷積神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)如下:
第一部分為骨干網(wǎng)絡(luò)模塊,輸入圖像經(jīng)過(guò)自下而上的ResNet50網(wǎng)絡(luò)以及自上而下的特征金字塔組成的骨干網(wǎng)絡(luò)提取到特征;
第二部分為路徑聚合模塊,骨干網(wǎng)絡(luò)橫向連接了一個(gè)自下而上的路徑聚合分支,從而得到新的特征圖;
第三部分為特征選擇模塊,新的特征圖經(jīng)過(guò)目標(biāo)候選網(wǎng)絡(luò)(RPN)得出不同尺度的目標(biāo)候選區(qū)域(proposals),并將候選區(qū)域與groundtruth(真值)映射到不同層級(jí)的特征圖中,分別計(jì)算IoU-loss的大小,選取最小loss的層級(jí)進(jìn)行后續(xù)的RoIAlign(區(qū)域特征對(duì)齊);
最后的輸出層利用proposals從特征圖中提取特征送入后續(xù)全連接和softmax網(wǎng)絡(luò)作回歸和分類(lèi)。
3.根據(jù)權(quán)利要求1所述的一種基于多層級(jí)特征選擇卷積神經(jīng)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)方法,其特征在于:在步驟(1)中,所述網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)設(shè)定和訓(xùn)練參數(shù)初始化如下:
(3.1)骨干網(wǎng)絡(luò)中卷積層的步長(zhǎng)設(shè)置為1,最大池化層步長(zhǎng)設(shè)置為2,輸出通道數(shù)為256;
(3.2)卷積層的權(quán)重初始化為均值為0、標(biāo)準(zhǔn)差為0.1的截?cái)嗾龖B(tài)分布噪聲,網(wǎng)絡(luò)中的所有偏置初始化為常量0.1;
(3.3)訓(xùn)練的batch size大小設(shè)置為2,即每次把2張圖片送入卷積神經(jīng)網(wǎng)絡(luò)中,總步長(zhǎng)為80000,初始學(xué)習(xí)率設(shè)置為0.0025,56000次迭代后將學(xué)習(xí)率調(diào)整為2.5×e-4。
4.根據(jù)權(quán)利要求1所述的一種基于多層級(jí)特征選擇卷積神經(jīng)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)方法,其特征在于:在步驟(2)中,對(duì)訓(xùn)練圖像進(jìn)行預(yù)處理和標(biāo)簽格式轉(zhuǎn)化如下:
(2.1)將圖像尺寸歸一化成1024*1024的大小;
(2.2)對(duì)圖像對(duì)應(yīng)的標(biāo)簽進(jìn)行轉(zhuǎn)化,統(tǒng)一轉(zhuǎn)化為訓(xùn)練要求的coco格式;
(2.3)將標(biāo)注形式為(x1,y1,x2,y2,x3,y3,x4,y4)的頂點(diǎn)坐標(biāo)轉(zhuǎn)化為(x,y,w,h,α1,α2,α3,α4)的滑動(dòng)頂點(diǎn)表示方式,其中(x1,y1,x2,y2,x3,y3,x4,y4)表示四邊形圖像的四個(gè)頂點(diǎn)坐標(biāo),(x,y)為表示訓(xùn)練圖像最小外接矩形的中心點(diǎn)坐標(biāo)(w,h)表示訓(xùn)練圖像最小外接矩形的寬和高,(α1,α2,α3,α4)為訓(xùn)練圖像在外接矩形各個(gè)邊上的偏移量。
5.根據(jù)權(quán)利要求1所述的一種基于多層級(jí)特征選擇卷積神經(jīng)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)方法,其特征在于:在步驟(2)中,所述對(duì)訓(xùn)練圖像進(jìn)行數(shù)據(jù)增強(qiáng)方法如下:采用對(duì)訓(xùn)練圖像進(jìn)行隨機(jī)翻轉(zhuǎn)和旋轉(zhuǎn)進(jìn)行圖像增強(qiáng)。
6.根據(jù)權(quán)利要求1所述的一種基于多層級(jí)特征選擇卷積神經(jīng)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)方法,其特征在于:在步驟(3)中,模型訓(xùn)練時(shí)的損失函數(shù)將會(huì)由分類(lèi)與回歸損失兩部分組成,其中回歸損失Lreg由水平框損失以及滑動(dòng)頂點(diǎn)損失兩部分組成:即Lreg=Lh+Lr,其中Lh為水平框損失,由smoothL1函數(shù)計(jì)算得到;Lr為滑動(dòng)頂點(diǎn)損失,公式如下:
其中,αi=(α1,α2,α3,α4),為訓(xùn)練圖像在外接矩形各個(gè)邊上的偏移量,l1,l2為為了判斷目標(biāo)框往哪個(gè)方向回歸設(shè)定的閾值,為αi的真值。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110090408.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





