[發明專利]基于卷積神經網絡的物品檢測方法在審
| 申請號: | 202210277747.6 | 申請日: | 2022-03-21 |
| 公開(公告)號: | CN114612770A | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 袁慶霓;白歡;王晨;楊觀賜;杜飛龍;藍偉文 | 申請(專利權)人: | 貴州大學 |
| 主分類號: | G06V20/00 | 分類號: | G06V20/00;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 貴陽東圣專利商標事務有限公司 52002 | 代理人: | 袁慶云 |
| 地址: | 550025 貴州省*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 物品 檢測 方法 | ||
1.一種基于卷積神經網絡的物品檢測方法,其特征在于:包括以下步驟:
步驟一:對樣本圖像進行圖像預處理,并將樣本圖像分為訓練圖像集和測試圖像集;
步驟二:構建目標檢測網絡模型:該目標檢測網絡模型以RFBNet網絡為基礎,首先采用雙線性插值方法對RFBNet網絡的卷積層Conv7、卷積層Conv9_2的特征圖擴大到與卷積層Conv4_3特征圖相同的尺寸,然后利用concat通道拼接方式進行特征融合,最后通過加入基于通道注意力機制的擠壓激勵SE模塊,使RFBNet網絡自動的重新分配特征通道權重來改善模型的性能,即通過提升重要層的網絡權重參數,降低次要層的網絡權重參數,提升目標的檢測效率;
所述雙線性插值方法:
步驟1:將所述卷積層conv7層特征圖擴大兩倍得到尺寸為38×38的特征圖,通道數為256個;將所述卷積層conv9_2層擴大8倍得到尺寸為40×40的特征圖,再通過卷積核大小為3×3、通道數為256的卷積運算得到尺寸為38×38的特征圖;將卷積層conv4_3層的特征圖通道數由512個降為256個,不改變特征圖的尺寸;
步驟2:將步驟1中卷積層conv7、conv9_2、conv4_3得到的特征圖通過concat疊加通道數的方式進行拼接,拼接后特征再經過通道數為512、卷積核大小為1×1的卷積運算及激活函數操作后得到新的融合特征;從而將語義信息豐富的深層特征融入到細節信息豐富的淺層特征中以提升網絡的特征提取能力;
步驟三:訓練目標檢測網絡模型:將訓練集中的每張訓練圖像輸入所述目標檢測網絡模型,首先將每張訓練圖像調整為尺寸大小一致,然后對每張訓練圖像使用N×N大小的網格進行分塊;當分塊的網格存在訓練圖像中待檢測目標的中心點時,該網格對該待檢測目標的種類和位置信息進行預測;
步驟四:使用所述目標檢測網絡模型進行檢測,得到檢測結果:輸入圖像進行檢測,利用步驟三中已經訓練好的目標檢測網絡模型進行測試,并通過非極大值抑制進行圖像后處理,通過閾值對冗余候選框進行篩選刪除,最后得到最優的候選框作為預測框輸出。
2.如權利要求1所述的基于卷積神經網絡的物品檢測方法,其特征在于:所述步驟一中對樣本圖像進行圖像預處理包括翻轉、縮放、色域變化,同時對樣本圖像進行數據增強,擴大數據集。
3.如權利要求1所述的基于卷積神經網絡的物品檢測方法,其特征在于:所述步驟一中將樣本圖像按9∶1的比例分為訓|練圖像集和測試圖像集。
4.如權利要求1所述的基于卷積神經網絡的物品檢測方法,其特征在于:所述步驟二中加入基于通道注意力機制的擠壓激勵SE模塊的具體操作:
首先是擠壓操作Fsq,具體過程就是將輸入為H×W×c2的特征通過全局平均池化操作變成1×1×c2的特征,c2為通道數,該特征具有全局的感受野,用公式表示為:
式中:H、W代表特征圖的高和寬,uc代表特征圖中的第c個通道,uc(i,j)為第c個通道中第i行、第j列的像素,zc為輸出;
其次是激勵操作Fex,用于生成每個通道的權重,用公式表示為:
s=Fex(z,w)=σ[W2δ(W1z)]
式中:z為擠壓操作的輸出,W1為全連接操作,δ為Relu激活函數,W2為全連接操作,σ為Sigmoid函數,s為輸出;
最后是注意操作Fscale,將激勵輸出的權重s分配到先前的通道上,用公式表示為:
y=Fscale(uc,sc)=sc·uc
式中:uc為特征中的第c個通道,sc為步長s中的第c個權重,y為輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州大學,未經貴州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210277747.6/1.html,轉載請聲明來源鉆瓜專利網。





