[發明專利]基于深度學習的快速行人檢測方法在審
| 申請號: | 201810001077.9 | 申請日: | 2018-01-02 |
| 公開(公告)號: | CN108229390A | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 孫君鳳;許宏吉;劉愛玲;房樺;劉琛 | 申請(專利權)人: | 濟南中維世紀科技有限公司;山東大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 濟南泉城專利商標事務所 37218 | 代理人: | 張貴賓 |
| 地址: | 250101 山東省濟南市濟南市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行人檢測 構建 行人數據 多通道視頻 標注信息 數據集 監控視頻圖像 預處理 標準數據 測試圖像 復雜背景 監控視頻 快速檢測 網絡模型 訓練模型 異常事件 拼接 微調 光照 采集 圖像 測試 場景 檢測 學習 發現 分析 | ||
1.一種基于深度學習的快速行人檢測方法,其特征在于:包括以下步驟:
(1)構建帶有標注信息的行人數據集:
采集不同場景下的監控視頻圖像,構建行人檢測標準數據集,并對數據集進行擴充,包含圖像及其標注信息;
(2)利用構建的行人數據集對網絡模型預訓練,生成適用于行人檢測的模型:
利用步驟一中準備好的數據集對預訓練模型進行微調,訓練為適用于所構建數據集的行人檢測模型;
(3)對訓練好的模型進行多通道視頻快速行人檢測的測試:
基于多通道視頻拼接方法,對待測試圖像進行預處理,輸入訓練好的模型進行檢測,得到目標的位置信息。
2.根據權利要求1所述的基于深度學習的快速行人檢測方法,其特征在于:
步驟(1)中:構建帶有標注信息的標準行人數據集,主要包括以下三部分:
1-1、采集不同場景下的行人畫面圖像;包含多種行人姿態、多種場景、多種光照影響以及一天中不同時段的視頻圖像,使得構造的數據集能夠有效覆蓋場景的多樣性;
1-2、對采集到的數據集進行有效的擴充,通過圖像鏡像、角度旋轉、尺寸縮放、添加隨機噪聲的方法;
1-3、對擴充后的數據集圖像生成對應的的標注及標簽信息,標注信息即樣本中目標的位置信息,標簽信息即樣本中目標所屬類別,類別為人標注為1或非人標注為-1。
3.根據權利要求1所述的基于深度學習的快速行人檢測方法,其特征在于:
步驟(2)中:利用構建的行人數據集訓練基于Faster R-CNN的模型:
通過上述構建的標注數據集,采用Faster R-CNN網絡結構對預訓練模型進行微調,訓練適用于行人檢測的模型;Faster R-CNN網絡包括用于產生候選區域的RPN卷積神經網絡和用于目標判別的fast R-CNN卷積神經網絡構成。
4.根據權利要求1所述的基于深度學習的快速行人檢測方法,其特征在于:
步驟(3)中:對訓練好的模型進行多通道視頻快速行人檢測的測試,主要包含以下三部分:
3-1、采用多通道視頻幀拼接方法生成待測試圖像
通過將多通道的監控視頻圖像進行拼接,組合成一幅大尺寸的圖像,然后將拼接后的圖像輸入到訓練好的模型中進行檢測,相當于多個通道的視頻幀同時進行檢測,能夠有效節省待檢測視頻的檢測時間;
3-2、 利用視頻幀預處理方法減少周圍環境的影響
在檢測過程中,圖像預處理的主要目的是消除圖像中的冗余信息,濾除干擾、噪聲,增強有關信息的可檢測性,從而提高后續特征提取和檢測的可靠性;
可用的圖像處理方法主要包括以下方法:直方圖均衡化、歸一化、Gamma校正;
3-3、將經過預處理過的拼接幀輸入到訓練好的模型中進行行人檢測,輸出行人位置信息及對應的置信度。
5.根據權利要求3所述的基于深度學習的快速行人檢測方法,其特征在于:
步驟(2)中:
利用已有的ImageNet模型在構建的數據集上進行微調,得到適用于行人檢測的新的分類模型,主要步驟如下:
2-1采用ImageNet模型的ZF-Net網絡進行預訓練,首先對該網絡模型的全連接層進行修改,輸出種類為兩類,即行人及非行人;
2-2在構建的樣本集上預訓練模型,Faster R-CNN包括用于提取候選區域的微調RPN網絡以及用于檢測目標的Fast R-CNN網絡;RPN網絡對輸入的包含行人的圖像進行處理,生成行人粗選區域;而Fast R-CNN網絡對這些行人粗選區域進行進一步的判別,輸出行人最終的位置信息;RPN網絡和Fast RCNN網絡能夠共享特征,減少了提取候選區域的時間,縮短了目標檢測的時間;
使用預訓練的方法主要是為了得到一個良好的網絡初始化值,以避免后續的訓練中陷入局部最小值,同時還能夠加快網絡的收斂速度;后續使用構建的樣本集對網絡進行微調,以確保參數更加適合當前的樣本集,提高在數據集上的檢測率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南中維世紀科技有限公司;山東大學,未經濟南中維世紀科技有限公司;山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810001077.9/1.html,轉載請聲明來源鉆瓜專利網。





