[發明專利]基于滑動窗口的車底圖片異物識別方法、裝置及存儲介質有效
| 申請號: | 202110588934.1 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113033720B | 公開(公告)日: | 2021-08-13 |
| 發明(設計)人: | 趙榮;成曉龍;趙智玉;徐梅娟 | 申請(專利權)人: | 南京索安電子有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 北京德崇智捷知識產權代理有限公司 11467 | 代理人: | 王斌 |
| 地址: | 210000 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 滑動 窗口 車底 圖片 異物 識別 方法 裝置 存儲 介質 | ||
本發明公開了一種基于滑動窗口的車底圖片異物識別方法、裝置及存儲介質,車底圖片異物識別方法包括如下步驟:步驟1,訓練異物識別網絡模型M,獲得異物識別網絡的參數;步驟2,采用滑動窗口將車底圖片切分為多個窗口圖像、多進程加載各窗口圖像數據、對窗口圖像進行預處理并輸入異物識別網絡M得到異物的識別結果。本發明通過多進程處理滑動窗口切分后的車底圖片,并結合對于中等目標識別更穩定的基于錨框的方法和對于小目標識別更靈活的基于特征點的方法,有效提高了高分辨率車底異物識別的效率和準確度。
技術領域
本發明涉及一種高效的基于滑動窗口的高分辨率車底圖片的小目標異物識別方法,屬于異物識別技術領域。
背景技術
為了防止不法分子在車輛底盤藏匿槍支、炸藥、毒品等危險物品,車輛底盤的異物識別是安全檢查中的重要一環。現有的車底異物識別方法有拍攝高清車底圖片并人工對圖片進行檢查,但是這種方法存在效率低、安檢人員長期監視圖片后判斷準確率下降等缺陷。一種更加高效的安檢方式為通過計算機視覺中基于深度學習的目標識別技術對車底圖片進行分析,從而自動地識別出車底存在的異物。
安全檢查系統拍攝的車底圖片存在以下特點:第一,圖片分辨率高。這導致圖片識別過程的計算開銷較大,耗時長,直接將高分辨率圖片輸入目標識別網絡往往需要數十秒才能得到識別結果;第二,車底異物多為小目標,即異物占整個車底圖片的比例較小。這使得通常的目標識別方法對異物的識別精度較低。
發明內容
本發明所要解決的技術問題是在車底圖片分辨率較高,和車底異物為小目標的情況下,提高車底異物識別的效率和準確率。
為了解決上述問題,本發明采用以下技術方案:
一種基于滑動窗口的車底圖片異物識別方法,其特征在于,包括以下步驟:
步驟1,訓練異物識別網絡模型M,獲得異物識別網絡的參數;
步驟2,采用滑動窗口將車底圖片切分為多個窗口圖像、多進程加載各窗口圖像數據、對窗口圖像進行預處理并輸入異物識別網絡M得到異物的識別結果。
步驟1包括:數據集的構建與劃分、車底圖片的預處理、異物識別網絡的前向傳播、異物識別網絡的參數更新。
步驟1-1,收集包含異物的車底圖片數據,包括車底圖片以及對應的異物標注邊界框和類別;將車底圖片數據劃分為訓練集和驗證集,然后將訓練數據隨機打亂并劃分為多個小批次,驗證集數據直接劃分為多個小批次;
步驟1-2,對輸入車底圖片進行預處理,首先以長寬分別為h、w的窗口從輸入車底圖片中隨機裁剪得到窗口圖像,然后對窗口圖像水平隨機翻轉并更新窗口圖像對應的異物標注邊框,最后對窗口圖像進行歸一化并轉換為Pytorch 張量,將小批次內的數據拼接,得到異物識別網絡M的輸入數據;
步驟1-3,將步驟1-2預處理得到的數據輸入異物識別網絡M中的骨干網絡,得到多尺度的特征圖;
骨干網絡可選用ResNet50骨干網絡,得到C2、C3、C4、C5四個多尺度的特征圖。
步驟1-4,將步驟1-3得到的多尺度特征圖輸入異物識別網絡M中的特征金字塔網絡,得到多個特征融合后的多尺度特征圖;
多個特征分別為P2、P 3、P 4、P 5、P 6、P 7六個特征。
步驟1-5,在步驟1-4輸出的每個特征圖Pi上分配多種尺度以及長寬比的錨框,將特征圖分別輸入異物識別網絡M中的基于錨框的預測網絡和基于特征點的預測網絡,得到每個錨框的分類值以及邊框回歸值,和每個特征點的分類值以及邊框回歸值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京索安電子有限公司,未經南京索安電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110588934.1/2.html,轉載請聲明來源鉆瓜專利網。





