[發明專利]一種基于深度學習的增強檢測遮擋目標的目標檢測方法在審
| 申請號: | 202211635125.2 | 申請日: | 2022-12-19 |
| 公開(公告)號: | CN115761220A | 公開(公告)日: | 2023-03-07 |
| 發明(設計)人: | 曹丹陽;楊建;馬金鋒;田學法;賀珊珊 | 申請(專利權)人: | 北方工業大學 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/44;G06V10/764;G06V10/82;G06N3/08;G06N3/0464 |
| 代理公司: | 北京萬馳專利代理事務所(普通合伙) 16106 | 代理人: | 王軍 |
| 地址: | 100144 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 增強 檢測 遮擋 目標 方法 | ||
本發明公開了一種基于深度學習的增強檢測遮擋目標的目標檢測方法,采用了Faster?RCNN作為網絡框架,主干特征提取網絡是一種用于提取圖像特征信息的深度殘差卷積結構,使用多層殘差塊進行特征提?。惶卣鹘鹱炙W絡能夠融合不同層的特征并輸出多層特征圖;空洞卷積層作用于特征金字塔網絡輸出的各層特征圖,擴大特征圖的感覺野;區域生成網絡通過在特征圖上滑動檢測圖像中可能含有目標的區域和位置,生成候選區域集;分類網絡和回歸網絡對候選區域中的目標做類別判定和進一步定位。本發明方法的網絡框架由于增加空洞卷積對特征圖的處理,擴大了特征圖的感受野,學習到更多輪廓特征,從而增強了網絡對遮擋目標的檢測效果。
技術領域
本發明涉及人工智能系統目標檢測領域,具體是一種基于深度學習的增強檢測遮擋目標的目標檢測方法。
背景技術
目標檢測是計算機視覺領域中一個富有挑戰性的課題,其主要目的是從靜態圖像或者視頻中識別并定位一個或多個有效目標。傳統的目標檢測任務主要通過人工提取特征模型建立,常用的特征包括:HOG(Histogram of Oriented Gradient,HOG),SIFT(Scale-invariant feature transform,SIFT)和Haar(Haar-like features,Haar)等,特征提取模型之后進行支持向量機或者Adaboost的分類任務,進而得到我們所關注的目標結果。由于這種特征模型對復雜場景多類目標的檢測具有局限性,因此當前最先進的目標檢測算法均引入具備更強大表征能力的深度卷積神經網絡得到圖像的多層特征信息,既包含前級卷積層得到的細節紋理等特征,又包含后級卷積層得到的在語義語境方面更加抽象的高層信息。在此基礎上結合多種候選邊框選取策略,結合區域回歸算法與物體分類算法形成可端到端訓練的,可應用于多種復雜場景的多目標檢測統一模型。
對遮擋目標的檢測是目標檢測領域的一個難點,由于無法提取到遮擋物體的全部特征,在檢測過程中存在一定的難度。目前針對遮擋目標的檢測方法是針對待檢測目標的特性做個性化的分析,例如在遮擋行人的檢測中,部分方法將人體分為頭部、四肢、軀干等關鍵部分分別檢測,再通過各個關鍵部分的檢測結果綜合判斷是否為行人。該類方法的是針對檢測特定物體進行設計,不具備一定的通用性。
發明內容
本發明的目的在于提供一種基于深度學習的增強檢測遮擋目標的目標檢測方法,能夠提高遮擋目標的檢測效果,提高MAP值,以解決上述背景技術中提出的圖像中遮擋目標的檢測效果較差的問題。
為實現上述目的,本發明提供如下技術方案:
一種基于深度學習的增強檢測遮擋目標的目標檢測方法,采用了Faster-RCNN作為網絡框架,包括ResNet50作為主干特征提取網絡、特征金字塔網絡(Feature PyramidNetwork,FPN)、空洞卷積操作、區域生成網絡(Region Proposal Network,RPN)、分類網絡和回歸網絡;所述主干特征提取網絡是一種用于提取圖像特征信息的深度殘差卷積結構,使用多層殘差塊進行特征提取;所述特征金字塔網絡利用低層特征高分辨率和高層特征的高語義信息,融合不同層的特征并輸出多層特征圖;所述空洞卷積層作用于特征金字塔網絡輸出的各層特征圖,擴大特征圖的感覺野;所述區域生成網絡通過在特征圖上滑動檢測圖像中可能含有目標的區域和位置,生成候選區域集;所述分類網絡和回歸網絡對候選區域中的目標做類別判定和進一步定位。該網絡框架由于增加空洞卷積對特征圖的處理,擴大了特征圖的感受野,學習到更多輪廓特征,從而增強了網絡對遮擋目標的檢測效果。
進一步的:所述空洞卷積層是基于Faster-RCNN網絡框架的基礎,選擇ResNet50骨干網絡,FPN特征金字塔網絡特征融合后進行增加的,作為進一步處理特征圖的操作。
進一步的:所述ResNet50層卷積網絡能夠在ImageNet數據集做預訓練,目標檢測網絡在WIDER FACE數據集上進行訓練。
進一步的:所述目標分類網絡是使用全連接層及Softmax方法輸出候選區域中目標所屬類別的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北方工業大學,未經北方工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211635125.2/2.html,轉載請聲明來源鉆瓜專利網。





