[發明專利]一種利用ReCNN融合上下文信息的行人檢測方法有效
| 申請號: | 201710670156.4 | 申請日: | 2017-08-07 |
| 公開(公告)號: | CN107563299B | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 李濤;李冬梅;趙雪專;裴利沈;朱曉珺;趙俊彬;汪偉;鄒香玲;郭航宇 | 申請(專利權)人: | 鄭州信息科技職業學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06N3/08 |
| 代理公司: | 鄭州聯科專利事務所(普通合伙) 41104 | 代理人: | 劉建芳 |
| 地址: | 450000 河南省鄭*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 recnn 融合 上下文 信息 行人 檢測 方法 | ||
1.一種利用ReCNN融合上下文信息的行人檢測方法,其特征在于,包括以下步驟:
步驟A:提取輸入圖像中包含上下文信息的特征;
所述的步驟A包括以下步驟:
步驟A1:定義監控視頻圖像總共包含N幀圖像,第t幀圖像表示為I(t),其中, t=1,2…,N;
步驟A2:利用一個截斷的卷積神經網絡提取I(t-2)、I(t-1)和I(t)連續三幀輸入圖像的三個特征圖組,分別表示為X(t-2)、X(t-1)和X(t),其中,
X(t)={x1(t),x2(t),…,xM(t)},
其中,M表示特征圖的數量;
步驟B:利用ReCNN對輸入圖像中的行人位置進行預測,獲取預測行人位置的掩碼圖,具體的:
利用ReCNN融合步驟A2中所述的連續三幀輸入圖像I(t-2)、I(t-1)和I(t)的三個特征圖組X(t-2)、X(t-1)和X(t),輸出一張預測行人位置的掩碼圖y:
其中,表示遞歸卷積核,Wif表示前向卷積核,和Wif的大小均為3×3,表示卷積操作,b表示偏移量,函數f(x)采用sigmoid激活函數;
步驟C:確定輸入圖像中行人的位置;
步驟D:訓練融合上下文信息的ReCNN網絡的參數。
2.根據權利要求1所述的一種利用ReCNN融合上下文信息的行人檢測方法,其特征在于,所述的步驟C包括以下步驟:
步驟C1:按比例將掩碼圖y放大,直至掩碼圖y的尺寸與輸入圖像的尺寸相同;
步驟C2:根據視頻輸入圖像中不同行人的尺寸,設置多個大小與行人尺寸對應的行人位置檢測框;
步驟C3:在掩碼圖y上以遍歷的方式滑動行人位置檢測框,若檢測框中所有元素值之和小于檢測框面積的60%,那么判斷此區域的行人位置檢測框中不包含行人,行人位置檢測框滑動到下一位置繼續檢測;反之,則判斷此位置的行人位置檢測框中包含行人;
步驟C4:所有尺寸的行人位置檢測框在掩碼圖y上滑動后,使用非最大抑制算法合并相交的檢測框,其中,當大檢測框覆蓋小檢測框時,保留大檢測框。
3.根據權利要求1所述的一種利用ReCNN融合上下文信息的行人檢測方法,其特征在于,所述的步驟D包括以下步驟:
步驟D1:確定訓練集;
步驟D2:確定目標函數;
步驟D3:訓練融合上下文信息的遞歸卷積神經網絡的參數。
4.根據權利要求3所述的一種利用ReCNN融合上下文信息的行人檢測方法,其特征在于,所述的步驟D3包括以下步驟:
步驟D31:計算掩碼圖對于目標函數的梯度;
步驟D32:計算遞歸卷積核關于目標函數的梯度;
步驟D33:計算前向卷積核Wif關于目標函數的梯度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州信息科技職業學院,未經鄭州信息科技職業學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710670156.4/1.html,轉載請聲明來源鉆瓜專利網。





