[發明專利]一種適用于小目標檢測的增強的全卷積實例語義分割算法在審
| 申請號: | 201811601302.9 | 申請日: | 2018-12-26 |
| 公開(公告)號: | CN109583517A | 公開(公告)日: | 2019-04-05 |
| 發明(設計)人: | 胡輝;司鳳洋 | 申請(專利權)人: | 華東交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 楊采良 |
| 地址: | 330000 *** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 算法 語義分割 小目標 卷積 特征圖提取 特征圖 共享 圖像處理技術 抓取 分類和回歸 產生位置 網絡效果 細節信息 語義信息 檢測 圖譜 敏感 融合 保留 | ||
1.一種適用于小目標檢測的增強的全卷積實例語義分割算法,其特征在于,所述適用于小目標檢測的增強的全卷積實例語義分割算法包括:
步驟一:共享特征圖提取,對不同層的特征圖的分辨率進行上采樣或下采樣并進行特征融合;
步驟二:預選框提取,conv3和conv4分別訓練兩個RPN網絡,對兩個RPN網絡產生的預選框采用非極大值抑制NMS進行綜合提取;
步驟三:產生基于位置敏感的分數圖譜,基于全卷積網絡FCN產生共享特征圖,再使用2k2×(C+1)-d維1×1卷積產生位置敏感的分數圖譜,其中C+1表示C個目標類別和1個背景類別,每個ROI的位置敏感特征圖譜由相應的k2個位置敏感圖譜拼接而成;
步驟四:分類和回歸,對于步驟三產生的ROI位置敏感圖譜進行回歸、對應的分數圖譜進行分類,分類中,通過拼接對應的ROI位置敏感圖譜得到像素級的分數圖譜,將ROI內的每個像素,通過兩個1×1的卷積分別判斷該像素是否在本ROI內和該像素是否在目標物體的邊界范圍內。
2.如權利要求1所述的適用于小目標檢測的增強的全卷積實例語義分割算法,其特征在于,步驟一,具體包括:
共享特征圖提取,在輸入圖片寬高比不變時,將短邊調整為600;采用ResNet-101基礎網絡模型融合conv1,conv3和conv5層的特征圖來提取共享特征圖;對不同層的特征圖采用不同的上采樣或下采樣使得特征圖的分辨率一致;
對于conv1采用dilation為2,stride為2,kernel為3,padding為0的膨脹卷積,使conv1層的特征圖的分辨率下降2倍;保持conv3分辨率不變;
融合conv3和降采樣后的conv1的特征圖,再使用1×1×512的卷積將來自conv1和conv3的特征圖壓縮在統一空間內;
conv5層采用dilation為2,stride為2,kernel為3,padding為0的反卷積(Deconv),使得conv5層的特征圖分辨率上采樣2倍;
使用1×1×512卷積融合來自conv1,conv3,conv5層的特征圖,最終實現特征融合。
3.如權利要求1所述的適用于小目標檢測的增強的全卷積實例語義分割算法,其特征在于,步驟二具體包括:
1)通過conv4層特征訓練深層RPN網絡;
2)在conv3的基礎上添加由3個3×3×512卷積層組成的語義增強網絡;
3)在步驟2)輸出的特征圖的基礎上,訓練淺層RPN網絡;
4)步驟1)和步驟3)的RPN網絡各自產生300個預選框,采用soft-NMS算法融合2個RPN網絡的預選框,并且設置soft-NMS算法的參數IoU為0.7,將預測分數最高的300個預選框保留。
4.如權利要求1所述的適用于小目標檢測的增強的全卷積實例語義分割算法,其特征在于,步驟三具體包括
使用2k2×(C+1)-d 1×1卷積產生位置敏感的分數圖譜,其中C+1表示目標類別和一個背景類別,設置(K,C)為(7,80);且每個特征圖譜相較輸入圖片的分辨率降采樣16倍,每個ROI由相應的k2個位置敏感圖譜組合形成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東交通大學,未經華東交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811601302.9/1.html,轉載請聲明來源鉆瓜專利網。





