[發明專利]一種城市行人檢測方法在審
| 申請號: | 201810696570.7 | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN109117717A | 公開(公告)日: | 2019-01-01 |
| 發明(設計)人: | 楊軍 | 申請(專利權)人: | 廣州烽火眾智數字技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京和信華成知識產權代理事務所(普通合伙) 11390 | 代理人: | 胡劍輝 |
| 地址: | 510000 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行人檢測 特征圖 原始圖像 整體特征 圖像 非極大值抑制 圖像處理模塊 圖像特征獲取 單一特征 放大圖像 分類網絡 候選窗口 檢測結果 局部特征 模塊接收 配合檢測 神經網絡 特征圖像 依次連接 誤判 分類器 檢測 后框 漏檢 加權 標注 尺度 出行 分類 | ||
1.一種城市行人檢測方法,其特征在于,包括以下步驟:
S1、通過安裝于城市道路旁的攝像頭采集行人圖像,并將采集的圖像上傳,通過圖像特征獲取模塊接收原始圖像;
S2、將接收的原始圖像通過圖像處理模塊進行處理,并提取其中的局部特征,進行放大,其中,所述圖像特征圖(或者叫地標圖)是指利用參數化特征(如點和線)的全局位置來表示環境;
S3、特征圖擴展:通過圖像冪率規則和圖像特征金字塔規則計算圖像臨近規模對應的特征圖;
S4、將所述整體特征圖像和所述局部特征放大圖像依次連接,并將整體特征圖像和所述局部特征放大圖像輸送到特征數據庫模塊進行比對;
S5、分類網絡訓練:利用多種尺度行人在不同特征圖中的的分布訓練深度神經網絡;
S6、行人檢測標注:將得到的兩種規模特征圖的候選窗口數目按比例匯總,經過S5中訓練好的分類器分類,經過非極大值抑制后框出行人;
S7、檢測結果顯示。
2.根據權利要求1所述的一種城市行人檢測方法,其特征在于,所述S2中將接收的圖像進行提取放大的步驟為:從整體特征圖像中,掃面選取行人的明顯特征,并通過放大,清晰的處理,將局部特征顯現處理,并進行保存。
3.根據權利要求1所述的一種城市行人檢測方法,其特征在于,所述S3中擴展的圖片規模和擴展次數不設限。
4.根據權利要求1所述的一種城市行人檢測方法,其特征在于,所述S3中對特征圖擴展的步驟為:通過圖像冪率規則和圖像特征金字塔規則計算圖像I1臨近規模對應的特征圖,一般利用fm=Cp(S(I1,M)),式中I1代表原圖像,M代表縮放規模,S代表將原圖縮放,Cp代表卷積池化操作計算特征,現在為減少卷積運算提高運行速度,利用公式:
其中:參數m表示當前規模,m′表示縮放后的規模,S代表將特征圖縮放m′/m倍,f表示特征,常系數α可以在訓練集上通過實驗測得,以上公式表明原圖Im通過卷積池化操作得到特征,臨近縮放規模圖像特征由已知特征圖近似計算得到,如1/2*I1可以計算得到f1/2,因為圖像上采樣沒有高頻損失,上采樣圖片的信息內容與低分辨率的內容相似,特征計算公式為:
fσ=σ*S(f1,σ)) (3.2)
式中f1代表原圖對應特征圖,S代表將特征圖f1放大σ倍,fσ為上采樣圖像。
5.根據權利要求1所述的一種城市行人檢測方法,其特征在于,所述S5中對分類網絡訓練包括:選擇在有多種行人尺度的KITTI數據集上實驗,我們在訓練數據集上將行人按高度分為X個尺寸的行人。
6.根據權利要求5所述的一種城市行人檢測方法,其特征在于,利用卷積層特征共享訓練RPN(region proposal network)網絡和softmax分類器聯合網絡,采用交叉輪流訓練的方式,先訓練區域提議網絡(R P N),再用提議(proposal)訓練基于區域的分類器網絡,再用分類器網絡訓練區域提議網絡,損失層(losslayer)是卷積神經網絡(CNN)的終點,接受兩個值作為輸入,其中一個是CNN的預測值,另一個是真實標簽。
7.根據權利要求6所述的一種城市行人檢測方法,其特征在于,所述損失層則將這兩個輸入進行一系列運算,得到當前網絡的損失函數(LossFunction),一般記做L(W),其中W是當前網絡權值構成的向量空間,訓練網絡的目的是在權值空間中找到讓損失函數L(W)最小的權值W(opt),可以采用隨機梯度下降(stochasticgradient descent)的最優化方法逼近權值W(opt),網絡中有兩個損失函數,一個是分類損失函數一個是回歸損失函數。
8.根據權利要求1所述的一種城市行人檢測方法,其特征在于,所述S6中對行人檢測標注的步驟為:每個規模的候選行人分別與S5中訓練得到的權重1x相乘,通過非極大值抑制,除去與最大置信度窗口重疊超過65%的窗口。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州烽火眾智數字技術有限公司,未經廣州烽火眾智數字技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810696570.7/1.html,轉載請聲明來源鉆瓜專利網。





