[發明專利]一種快速行人檢測方法及裝置有效
| 申請號: | 201810069322.X | 申請日: | 2018-01-24 |
| 公開(公告)號: | CN108399362B | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 林倞;尹森堂;張冬雨;王青 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 廣州容大知識產權代理事務所(普通合伙) 44326 | 代理人: | 劉新年 |
| 地址: | 510000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 快速 行人 檢測 方法 裝置 | ||
1.一種快速行人檢測方法,包括如下步驟:
步驟S1,構建可配置的基于卷積神經網絡的深度模型,利用訓練樣本學習出構建的網絡參數,獲得用于測試過程的模型;
步驟S2,輸入測試樣本,通過訓練好的模型利用神經網絡感知域的變化規律使用不同的中間層對不同尺度范圍內的目標物體進行檢測,預測出圖像中目標物體的框圖;
步驟S1進一步包括:
構建可配置的基于卷積神經網絡的深度模型;
輸入訓練樣本;
初始化卷積神經網絡及其參數,包括網絡層中每層連接的權重和偏置;
采用前向傳播算法和后向傳播算法,利用訓練樣本學習出構建的網絡參數,即用于測試過程的模型;
所述深度模型包括多尺度的目標候選網絡與目標檢測網絡,所述目標候選網絡基于卷積神經網絡不同層提出特征的差異性,在中間層分別生成對不同尺度目標物體的候選框圖;所述目標檢測網絡在所述目標候選網絡輸出的候選框圖的基礎上進行精細化的分類和檢測;
所述卷積神經網絡由卷積層、降采樣層、上采樣層堆疊而成,所述卷積層是指對輸入的圖像或者特征圖在二維空間上進行卷積運算,提取層次化特征;所述降采樣層使用沒有重疊的max-pooling操作,該操作用于提取形狀和偏移不變的特征,同時減少特征圖大小,提高計算效率;所述上采樣層,是指對輸入的特征圖在二維空間上進行去卷積的操作,用以增大特征圖的像素。
2.如權利要求1所述的一種快速行人檢測方法,其特征在于:所述深度模型采用Squeeze VGG-16卷積神經網絡作為骨干網絡,所述Squeeze VGG-16卷積神經網絡采用conv1-1層和緊隨其后的12層Fire模塊層為特征提取的網絡結構。
3.如權利要求2所述的一種快速行人檢測方法,其特征在于:所述目標候選網絡在所述Squeeze VGG-16卷積神經網絡基礎上,根據卷積層特征,在Fire9、Fire12、conv6以及增加的pooling層,產生網絡分支,以進行不同尺度檢測到物體的候選框的回歸。
4.如權利要求2所述的一種快速行人檢測方法,其特征在于:所述目標檢測網絡在所述目標候選區域的基礎上,將目標候選區域預設倍數大小的圖片區域作為目標的背景語義信息,將Fire9層的特征圖進行一次上采樣,作為增強對小物體感知的信息,并將背景語義信息與上采樣信息經過感興趣區域的池化獲得固定大小的特征,之后增加一層全連接層,進行類別和最終候選框的回歸。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810069322.X/1.html,轉載請聲明來源鉆瓜專利網。





