[發明專利]一種引入注意力機制的行人檢測方法在審
| 申請號: | 202110276432.5 | 申請日: | 2021-03-15 |
| 公開(公告)號: | CN113011308A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 劉琚;張杰;孫國霞;江瀟;張昱;趙雪圻;魯昱 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 李健康 |
| 地址: | 266237 *** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 引入 注意力 機制 行人 檢測 方法 | ||
1.一種引入注意力機制的行人檢測方法,該方法基于YOLOv3目標檢測網絡,并加入針對卷積核的注意力機制SKNet網絡結構,通過注意力機制模塊改變特征圖中原始通道的卷積核權重,使得被遮擋通道權重降低,未被遮擋通道權重提高,從而提高被遮擋行人的檢測效果,該方法包括以下步驟:
步驟1:將獲取的行人檢測數據集進行預處理;
步驟2:構建引入注意力機制的行人檢測卷積神經網絡,所述引入注意力機制的行人檢測卷積神經網絡包括用于特征提取的基礎網絡結構darknet53、添加的注意力機制模塊SKNet中包含3×3,5×5,7×7三種不同卷積核應對不同尺度的行人,以及實現多尺度檢測的三條分支Y1,Y2,Y3;
步驟3:將預處理后的行人檢測數據集通過所述引入注意力機制的行人檢測卷積神經網絡得到預測結果,利用損失函數計算預測結果與標簽的誤差;
步驟4:基于損失函數對所述引入注意力機制的行人檢測卷積神經網絡進行優化,通過梯度下降與反向傳播不斷迭代以更新網絡參數,使網絡達到最優性能;
步驟5:當引入注意力機制的行人檢測卷積神經網絡在行人檢測數據集達到理想精度后進行稀疏訓練,對需要剪枝的層對應的批標準化γ系數進行大幅壓縮,然后就可以對不重要的通道或者層進行剪枝。
步驟6:將待檢測的行人圖像輸入到達到最優性能的所述引入注意力機制的行人檢測卷積神經網絡,得到最終的檢測結果。
2.如權利要求1所述的引入注意力機制的行人檢測方法,其特征在于:所述步驟2中,經過darknet53網絡獲得的特征圖X使用三個不同的卷積核3×3,5×5,7×7,三種不同卷積核應對三種不同尺度的行人分組卷積之后得到U1,U2,U3三個特征圖,然后相加得到了U,如式(1)所示:
U=U1+U2+U3 (1)
U中融合了多個感受野的信息,得到的U形狀是[C,H,W]的特征圖,其中C代表特征圖通道數,H代表特征圖高度,W代表特征圖寬度,然后沿著H和W維度求平均值,獲得每一個通道上的全局信息如式(2)所示:
其中sc表示獲得的全局信息,代表全局平均池化,H表示特征圖的高度,W表示特征圖的寬度,U(i,j)表示特征圖中每個點;
之后對輸出sc做全連接找到每一個通道占的比重大小,如式(3)所示:
其中z表示每一個通道占的比重大小,表示全連接層函數,δ是relu函數,B表示批標準化處理,W是一個d×C維的向量;
為了研究d對模型效率的影響,引入了一個衰減率r來控制d的值,如式(4)所示:
其中d表示W的第一個特征維度,C代表通道數,L設置為32;
然后分別使用了三個線性變換,從Z維變為原來的C維,這樣完成了針對通道維度的信息提取,之后再使用Softmax函數進行歸一化,如式(5)所示:
其中Ac,Bc,Cc分別表示三個不同的線性變換,z表示每一個通道占的比重大小;
這時每個通道對應一個分數,代表其通道的重要程度,這相當于一個掩膜,將這三個分別得到的掩膜分別乘以對應的U1,U2,U3,得到A1,A2,A3,然后三個模塊相加,進行信息融合,得到最終模塊V,如式(6)所示:
V=acU1+bcU2+ccU3 (6)
模塊V相比于最初的特征圖X經過了信息的提煉,融合了多個感受野的信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110276432.5/1.html,轉載請聲明來源鉆瓜專利網。





