[發明專利]一種基于神經網絡的快速行人檢測方法有效
| 申請號: | 201710051125.0 | 申請日: | 2017-01-23 |
| 公開(公告)號: | CN106934344B | 公開(公告)日: | 2020-01-31 |
| 發明(設計)人: | 彭進業;胡洋;王珺;李展;祝軒;王琳;文才;艾娜 | 申請(專利權)人: | 西北大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 61216 西安恒泰知識產權代理事務所 | 代理人: | 王芳 |
| 地址: | 710069 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 快速 行人 檢測 方法 | ||
1.一種基于神經網絡的快速行人檢測方法,該方法的檢測對象為任一路面的彩色圖像,其特征在于,包括:
步驟一,將彩色圖像數據轉換為一個3x448x448的矩陣;
步驟二,對3x448x448的矩陣進行25次卷積或最大池化操作,得到一個1024x14x14的矩陣;
將所述1024x14x14的矩陣調整為14x14x1024的矩陣,所述14x14x1024的矩陣表示圖像被分割為14x14個空間位置,每一個空間位置上有一個1024維向量;
步驟三,依次選取14x14個空間位置中的一個空間位置作為當前空間位置;
在該當前空間位置上預設9個窗口,所述9個窗口包圍該空間位置的行人,設該當前空間位置上窗口的橫坐標為xn,窗口的縱坐標為yn,窗口的寬度為wn,窗口的高度為hn,n=1,2,...,9;
(1)將該當前空間位置上的1024維向量通過一個全連接層,得到45維向量,所述45維向量包括該當前空間位置的窗口的行人局部概率Pn,窗口調整后的橫坐標x′n,窗口調整后的縱坐標y′n,窗口調整后的寬度w′n,窗口調整后的高度h′n,n=1,2,...,9;
選取Pn中最大的值所對應的窗口作為當前窗口,將該當前窗口的行人局部概率作為該當前空間位置的局部概率Pij,1≤i≤14,1≤j≤14,i和j取整數;
(2)對步驟二得到的1024x14x14的矩陣進行卷積,得到256x14x14的矩陣;
將256x14x14的矩陣調整為50176維向量,將該50176維向量通過一個全連接層,得到196維向量;
通過Logistic回歸公式將所述196維向量中的每一維映射到0~1之間得到Mij,所述Mij表示全局概率,1≤i≤14,1≤j≤14,i和j取整數;
步驟四,將Pij和Mij進行相乘,得到每個空間位置的行人總概率;
設置閾值a,若空間位置的行人總概率大于a,則該空間位置檢測為行人;0.1≤a≤0.2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北大學,未經西北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710051125.0/1.html,轉載請聲明來源鉆瓜專利網。





