[發明專利]一種基于改進YOLOv4的遮擋行人實時檢測方法在審
| 申請號: | 202111596446.1 | 申請日: | 2021-12-24 |
| 公開(公告)號: | CN114330529A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 梁燕;朱清 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V40/10;G06V10/774;G06V10/762;G06V10/764 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 廖曦 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 yolov4 遮擋 行人 實時 檢測 方法 | ||
本發明涉及一種基于改進YOLOv4的遮擋行人實時檢測方法,屬于計算機視覺領域。該方法包括:獲取數據集并對其處理;使用K_means++算法進行聚類,生成最終的先驗框;利用主干特征網絡融合通道注意力機制進行特征提取;利用空間金字塔SPP模塊對主干特征網絡提取的特征圖進行最大池化并合并;將主干特征網絡中大殘差塊獲取的后四層特征圖進行特征融合處理;將特征融合后的特征圖通過YOLO檢測頭進行結果預測,對目標位置和類別進行預測,利用損失函數訓練模型;將模型訓練生成的最優權重用于模型中,將測試集圖片放入模型中進行測試。本發明實現了實時對遮擋行人的高精度檢測,使用參數少,檢測速度快。
技術領域
本發明屬于計算機視覺技術領域,涉及一種針對復雜場景下對遮擋行人的檢測方法。
背景技術
隨著深度學習的不斷發展,引領著目標檢測領域快速地發展。行人檢測作為目標檢測領域的一個重要方向,隨著智能監控、智能交通等應用領域的發展,使得行人檢測也逐漸成為計算機領域中一個具有重要研究價值和研究意義的課題。由于應用領域場景的需求,準確、實時的行人檢測中是非常有必要的。
傳統行人檢測方法是建立在手工制作特征和淺層可訓練架構上的,采用從目標檢測器和場景分類器中結合量低水平圖像特征和高水平語義信息來構建成復雜的系統。傳統目標檢測方法取得了一定的成果,但也暴露了其固有的弊端。傳統的目標檢測算法由于魯棒性不好,泛化性差,繁雜的算法步驟導致檢測效率慢、精度不高的檢測方法已經難以滿足人們對目標檢測高性能效果的需求。隨著深度學習在目標檢測領域的發展,基于深度學習的目標檢測已成為主流檢測算法。主流的目標檢測算法主要分為雙階段檢測算法和單階段檢測算法。雙階段檢測算法是以R-CNN為代表的基于候選區域的目標檢測算法,主要包括R-CNN、Fast R-CNN、Faster R-CNN。該檢測算法通常分為兩步:第一步是從圖像中提取建議框,并剔除一部分背景建議框,同時做一次位置修正;第二步是對每個建議框進行檢測分類和位置修正。該類算法在一定程度上提升了目標檢測的準確率,但在檢測速度上不能達到實時檢測。單階段檢測算法是以YOLO、SSD系列為代表的基于回歸分析的目標檢測算法。該檢測方法不再使用建議框進行“粗檢測+精修”,而采用一步到位的方法得到結果,單階段目標檢測算法只進行一次前饋網絡計算,因此在速度上有了很大提升。
通用的目標檢測算法對于圖像清晰、無遮擋行人的檢測效果極佳。但對于圖像分辨率較低、圖像模糊以及存在遮擋情況下的行人仍然存在著較大的漏檢、錯檢等情況。由于復雜場景下或者人流量較大的場景下,會出現遮擋情況導致有效特征提取困難,影響著最終檢測效果。常見的遮擋分為類間遮擋和類內遮擋兩種情況。類間遮擋是指目標行人被場景中的車輛、房子、樹等一些背景物體所遮擋,類內遮擋是指行人間的相互遮擋。由于密集場景下存在著大量的遮擋情況,導致行人特征缺失、檢測精確度大大降低。為了保證行人檢測的準確度,降低漏檢率和錯檢率,就需要提取更加充分有效的深層語義特征,這樣勢必會加深模型的網絡結構,增加相應的計算量和參數量,大大降低了模型檢測速度,導致模型無法進行實時、高效地檢測。如果要保證檢測速度,可以減少模型網絡層數或復雜程度,從而減少參數量和計算量,提高相應的檢測速度。但這樣會導致有效特征提取不充分,丟失部分重要特征,導致漏檢或錯檢。因此,亟需設計一種檢測模型,即能夠高效地去檢測遮擋目標,同時又能夠使模型的檢測速度不降低,達到實時檢測是具有重要的理論和實際意義。
發明內容
有鑒于此,本發明的目的在于提供一種基于改進YOLOv4的遮擋行人實時檢測方法,針對復雜場景下、存在大量遮擋情況下對行人檢測,該檢測方法具有較高的精確度和實時的檢測速度。
為達到上述目的,本發明提供如下技術方案:
一種基于改進YOLOv4的遮擋行人實時檢測方法,具體包括以下步驟:
S1:獲取WiderPerson數據集,并將其劃分為訓練集、驗證集和測試集,同時使用數據增強手段和圖片拼接技術對數據集進行處理,使訓練集更加充分廣泛,豐富檢測物體的背景信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111596446.1/2.html,轉載請聲明來源鉆瓜專利網。





