[發明專利]一種引入注意力機制的行人檢測方法在審
| 申請號: | 202110276432.5 | 申請日: | 2021-03-15 |
| 公開(公告)號: | CN113011308A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 劉琚;張杰;孫國霞;江瀟;張昱;趙雪圻;魯昱 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 李健康 |
| 地址: | 266237 *** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 引入 注意力 機制 行人 檢測 方法 | ||
本發明提出一種引入注意力機制的行人檢測方法。針對行人檢測因存在行人相互遮擋、尺寸大小不一會導致大量的漏檢的現象。本發明提出的方法基于YOLOv3目標檢測網絡,并加入針對卷積核的注意力機制SKNet網絡結構,通過注意力機制模塊改變特征圖中原始通道的卷積核權重,使得被遮擋通道權重降低,未被遮擋通道權重提高;此外通過注意力機制模塊改變特征圖中原始通道的卷積核權重,使得不同的圖像能夠得到具有不同重要性的卷積核,提高多尺度預測效果,優化小行人檢測效果。本發明設計的方法在復雜的行人檢測應用場景中進行了實驗,減小了漏檢率,達到了優異的效果,充分證明方法具有較強的泛化能力。
技術領域
本發明涉及一種引入注意力機制的行人檢測方法,屬于計算機視覺中的行人檢測技術領域。
背景技術
行人檢測是計算機視覺和模式識別領域中的重要課題之一。行人檢測可以簡單分為兩個任務:定位、分類。定位就是將行人在圖像中的具體位置標識出來,得到對應的回歸框。分類就是對行人目標賦予標簽,由于行人檢測只存在兩個類別,即行人以及背景,所以分類任務比較容易完成。因此,行人檢測的最重要的任務就是對行人目標進行準確定位。行人檢測技術有很強的使用價值,它可以與多人跟蹤、行人重識別等技術結合,應用于汽車無人駕駛系統、智能機器人、智能視頻監控、人體行為分析、人流量統計系統、智能交通領域。行人檢測的目標是要為出現在一幅圖像內的每一個行人用一個矩形框標記出來。然而由于行人兼具剛性和柔性物體的特性,極大地受到行人個體之間外觀差異的影響,且往往攝像頭距離行人較遠,使得行人多為中小物體,現實場景下行人實例也相對密集。傳統的行人檢測方法主要利用行人外觀等淺層信息作為判斷依據,容易導致誤判;此外,由于采用的特征往往是人為設計的,因此對扭曲、拉伸等行人不能很好地進行檢測;最后在復雜場景下,行人存在相互遮擋、尺寸不一等現象,會導致大量的漏檢。針對目前行人檢測中的行人遮擋問題,目前已有的有效手段包括采用注意力機制,通過改變特征圖中原始通道的權重,使得被遮擋通道權重降低,未被遮擋通道權重提高,從而提高被遮擋行人的檢測效果;或將行人劃分成網格,利用網絡進行學習,從而預測出此行人是否被遮擋,進而改變其檢測分數;還有通過構建密度圖模塊來學習行人密度,并設計Adaptive NMS針對性地改變NMS后處理的交并比(Intersection Over Union,IOU)閾值。
由于行人的本身的特點如外觀、姿態、尺寸各不相同,并且還會受到天氣、背景、交通狀況等多種因素的影響,且行人多處于紛繁復雜的城市街景中,有很多干擾背景如電線桿、樹木等類似行人外觀的垂直結構,使得網絡誤認為它們是行人,從而造成大量的錯檢、漏檢問題。因此,如何進一步解決行人漏檢是亟待解決的問題。
發明內容
針對現有技術的不足,本發明提供了一種引入注意力機制的行人檢測方法。具體技術方案如下:
一種引入注意力機制的行人檢測方法,該方法基于YOLOv3目標檢測網絡,并加入針對卷積核的注意力機制SKNet網絡結構,通過注意力機制模塊改變特征圖中原始通道的卷積核權重,使得被遮擋通道權重降低,未被遮擋通道權重提高,從而提高被遮擋行人的檢測效果,該方法包括以下步驟:
步驟1:將獲取的行人檢測數據集進行預處理;
步驟2:構建引入注意力機制的行人檢測卷積神經網絡,所述引入注意力機制的行人檢測卷積神經網絡包括用于特征提取的基礎網絡結構darknet53、添加的注意力機制模塊SKNet中包含3×3,5×5,7×7三種不同卷積核應對不同尺度的行人,以及實現多尺度檢測的三條分支Y1,Y2,Y3;
步驟3:將預處理后的行人檢測數據集通過所述引入注意力機制的行人檢測卷積神經網絡得到預測結果,利用損失函數計算預測結果與標簽的誤差;
步驟4:基于損失函數對所述引入注意力機制的行人檢測卷積神經網絡進行優化,通過梯度下降與反向傳播不斷迭代以更新網絡參數,使網絡達到最優性能;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110276432.5/2.html,轉載請聲明來源鉆瓜專利網。





