[發明專利]一種基于深度學習的視頻圖像小目標檢測方法有效
| 申請號: | 202110345772.9 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN112966659B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 邱雁成;鄒勤 | 申請(專利權)人: | 北灣科技(武漢)有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430074 湖北省武漢市東湖新技術*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 視頻 圖像 目標 檢測 方法 | ||
本發明公開了一種基于深度學習的視頻圖像小目標檢測方法。主要用于在視頻圖像中檢測小目標,構建了一種層次化尺度敏感的深度卷積神經網絡模型,它摒棄了錨框機制和區域提議機制,采用了類似多任務學習的三分支并行檢測架構。利用小、中、大三個尺度的目標在不同深度的基礎卷積特征中的表達差異性,產生三種對應不同尺度性質的融合特征,使用三個并行分支在這三種融合特征上分別檢測三個尺度范圍的目標。使用層次化多尺度訓練機制使得三個并行檢測分支互相獨立、互不干擾地運行,極大提高了對小目標的檢測能力,并能穩定地在目標尺度范圍變化復雜的場景下使用。其對偶方向矢量機制來預測傾斜框的姿態,有效提升了對小目標的檢測性能。
技術領域
本發明涉及計算機視覺和視頻圖像智能分析領域,具體涉及一種基于深度學習的視頻圖像小目標檢測方法。
背景技術
隨著深度學習技術在計算機視覺領域的迅猛發展,其對目標檢測的能力越來越強。目標檢測任務中,有些目標的像素面積非常小,如小于30×30像素,一般被稱為小目標。小目標檢測是一項非常具有挑戰性的任務。但在實際應用中,小目標檢測具有非常廣泛的需求,例如無人機航拍影像中車輛的檢測、遙感影像中籃球場的檢測、顯微圖像中細胞的檢測等。隨著無人機、遙感衛星、顯微成像技術的快速發展,高精度的小目標檢測技術已成為越來越迫切的需求。
通常,目標檢測技術是在視頻圖像中用一組方框將目標標示出來。傳統的方法都是首先手工設計特征,然后通過提取的手工特征構造模板得到特征向量,最后使用AdaBoost或者SVM訓練分類器。這樣構建的目標檢測器往往性能很差,因為采集數據時對光照條件、氣象條件和拍攝姿態的影響非常敏感,成像效果差別非常大,手工設計的特征魯棒性非常低,使得目標檢測的精度較低,而面對小目標檢測時,其誤檢率更高、檢出率更低。
近年來,深度神經網絡的應用在目標檢測領域取得了非常驚人的成果。與傳統方法相比,基于深度卷積神經網絡目標檢測算法在通用目標檢測任務上的性能提高了60%之多,并且仍在不斷上升。然而,小目標檢測仍然面臨許多困難和挑戰。在同一幅圖像中,就同一種目標來說,有的目標像素面積可能非常大,而有的目標可能很小,且可能呈現為纖細的長條形,如船舶,它們的尺度變化范圍非常廣。小目標通常占據很少的像素面積,在圖像上顯現為一小團像素塊,朝向可以為任意方向,容易混雜在背景信息中,也給小目標檢測帶來了巨大困難??偟膩碚f,小目標檢測面臨面積小、尺度多變和方向多變等問題。
本發明針對小目標檢測的難題,發明了一種基于深度學習的小目標檢測方法,解決視頻圖像小目標檢測的多尺度、多方向等難題。
發明內容
為解決上述背景技術中存在的問題,本發明實例提出一種基于深度學習的小目標檢測方法,包含一種層次化尺度敏感的小目標檢測網絡設計架構,和一種能增強卷積網絡尺度敏感性的多尺度訓練機制。
本發明的技術方案包含以下步驟:
步驟S1,制作訓練樣本構建數據集,所述數據集中圖片為包含待檢測類別目標的影像,且目標具有不同的尺度,需包含大尺度(如大于90×90像素),小尺度(如小于30×30像素),以及中尺度(介于小尺度和大尺度之間),對圖像中的目標使用傾斜框標注。
步驟S2,構建神經網絡檢測模型,該模型分為三部分:基礎特征提取模塊,特征融合模塊、方框檢測模塊。其中,在基礎特征提取模塊之后,網絡分成了三個分支,每個分支包含獨立的特征融合模塊和方框檢測模塊,三個分支分別檢測大、中、小三個尺度的目標。
步驟S3,構建層次化多尺度訓練機制,使用S1構建的數據集對步驟S2構建的檢測模型進行訓練。該訓練機制使S2所構建的模型中各尺度分支互相獨立、互不影像地預測各自尺度范圍內的目標。
步驟S4,利用步驟S3訓練好的模型在視頻圖像中檢測目標。
進一步地,上述步驟S1具體如下。
步驟S1-1,在視頻圖像數據系統中,選擇不同場景的含有待檢測目標的場景,收集M張樣本圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北灣科技(武漢)有限公司,未經北灣科技(武漢)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110345772.9/2.html,轉載請聲明來源鉆瓜專利網。





