[發明專利]一種復雜場景下融合運動信息的行人檢測方法有效
| 申請號: | 202011290529.3 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112347967B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 侯舒娟;韓羽菲;李海;張欽;宋政育;武毅 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V20/52;G06V10/25;G06V10/44;G06V10/80;G06V10/82;G06N3/0464;G06N3/047;G06N3/08 |
| 代理公司: | 北京理工大學專利中心 11120 | 代理人: | 李微微 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 復雜 場景 融合 運動 信息 行人 檢測 方法 | ||
1.一種復雜場景下融合運動信息的行人檢測方法,其特征在于,包括如下步驟:
步驟1、獲取原始視頻,處理得到圖片序列;
步驟2、將所述圖片序列通過RPN網絡,獲得目標檢測提議候選框;
步驟3、將所述原始視頻通過運動目標識別算法,獲得運動目標框;
步驟4、將步驟3獲得的運動目標框與步驟2中的目標檢測提議候選框進行融合,得到全部提議候選框;所述融合利用非極大抑制值算法進行;
步驟5、將步驟4獲得的全部提議候選框按照尺寸大小劃分成兩個群組,分別輸入到兩個神經網絡分別進行分類和回歸處理;
步驟6、將步驟5中兩個神經網絡輸出的行人檢測結果一并輸出,得到帶有行人目標框的視頻。
2.如權利要求1所述的復雜場景下融合運動信息的行人檢測方法,其特征在于,所述步驟1中,對圖片序列中圖片先進行縮放后輸入卷積網絡獲取每張圖片的特征圖,然后再獲得目標檢測提議候選框,具體為:
a.利用九種不同尺寸的anchor?boxes對圖片中每一個像素點進行分類,判斷是物體還是背景;
b.對anchors進行回歸,得到分類的精準參數;
c.按照anchor的softmax分數進行排序,找到分類最優的2000個;
d.將anchor映射回原圖;
e.利用NMS算法,對anchor進行排序,輸出前256個提議候選框。
3.如權利要求1所述的復雜場景下融合運動信息的行人檢測方法,其特征在于,所述步驟2和3同步執行。
4.如權利要求1所述的復雜場景下融合運動信息的行人檢測方法,其特征在于,所述步驟3中,利用GMM算法對原始視頻序列進行運動目標識別,獲得運動目標框。
5.如權利要求1所述的復雜場景下融合運動信息的行人檢測方法,其特征在于,所述步驟5中,將步驟4中獲得的全部提議候選框按照面積大小進行排序,將面積排在前50%的圖片劃為第一群組,將面積排在后50%的劃為第二群組。
6.如權利要求5所述的復雜場景下融合運動信息的行人檢測方法,其特征在于,所述步驟5中,在每個神經網絡中,先對提議候選框部分的特征圖采用Faster-RCNN網絡的ROI池化層進行歸一化處理;將該部分特征圖輸入Faster-RCNN網絡的全連接層與softmax層計算每個提議目標屬于什么類別,利用只包含人物標簽的數據集進行預訓練;同時再次利用目標框回歸獲得每個提議目標的位置偏移量。
7.如權利要求5所述的復雜場景下融合運動信息的行人檢測方法,其特征在于,所述步驟5中,所述兩個神經網絡的結構相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011290529.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種透光度實時可調的窗機構
- 下一篇:一種可快速更換收卷筒的紡織面料收卷裝置





