[發(fā)明專利]基于精簡卷積神經(jīng)網(wǎng)絡(luò)的行人檢測方法在審
| 申請?zhí)枺?/td> | 201810673838.5 | 申請日: | 2018-06-27 |
| 公開(公告)號: | CN109165542A | 公開(公告)日: | 2019-01-08 |
| 發(fā)明(設(shè)計)人: | 芮挺;鄒軍華;楊成松;王東;解文彬;趙啟林;殷勤;邵發(fā)明;田輝;陸鳴;張釜愷;艾勇保 | 申請(專利權(quán))人: | 中國人民解放軍陸軍工程大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京理工大學(xué)專利中心 32203 | 代理人: | 吳茂杰 |
| 地址: | 210007 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積神經(jīng)網(wǎng)絡(luò) 行人檢測 數(shù)據(jù)集圖像 灰度圖像 測試集 預(yù)處理 訓(xùn)練集圖像 白化處理 尺寸變換 模型獲取 冗余數(shù)據(jù) 網(wǎng)絡(luò)規(guī)模 網(wǎng)絡(luò)模型 網(wǎng)絡(luò)訓(xùn)練 現(xiàn)場圖像 歸一化 數(shù)據(jù)集 剪枝 卷積 驗證 圖像 | ||
本發(fā)明公開一種基于精簡卷積神經(jīng)網(wǎng)絡(luò)的行人檢測方法,包括如下步驟:(10)數(shù)據(jù)集收集:將數(shù)據(jù)集圖像分為訓(xùn)練集圖像與測試集圖像;(20)數(shù)據(jù)集圖像預(yù)處理:對數(shù)據(jù)集圖像進行尺寸變換、對比度歸一化和白化處理,得到低冗余數(shù)據(jù)灰度圖像;(30)精簡卷積神經(jīng)網(wǎng)絡(luò)模型獲取:對卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,對訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)逐層進行剪枝,利用測試集灰度圖像驗證卷積神經(jīng)網(wǎng)絡(luò)的性能,得到精簡深度卷積網(wǎng)絡(luò)模型;(40)行人檢測:利用精簡卷積神經(jīng)網(wǎng)絡(luò)模型,對使用現(xiàn)場圖像進行行人檢測。本發(fā)明的基于精簡卷積神經(jīng)網(wǎng)絡(luò)的行人檢測方法,在保持網(wǎng)絡(luò)訓(xùn)練精度的同時,對卷積神經(jīng)網(wǎng)絡(luò)進行精簡,在減少網(wǎng)絡(luò)規(guī)模的同時,加快行人檢測的速度。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像識別技術(shù)領(lǐng)域,特別是一種內(nèi)存占用小、運行速度快的基于深度卷積神經(jīng)網(wǎng)絡(luò)的行人檢測方法。
背景技術(shù)
在計算機視覺領(lǐng)域,行人檢測是一項非常重要的研究內(nèi)容,被廣泛應(yīng)用在汽車自主駕駛,公共場所人流監(jiān)控等場景。
傳統(tǒng)的行人檢測技術(shù)是通過人工設(shè)計特征,如HOG-特征,訓(xùn)練分類器來進行行人檢測。面對檢測對象的場景變化和數(shù)量劇增,人工設(shè)計特征的代價太大,無法滿足實時性要求和魯棒性。
2006年以來,深度學(xué)習(xí)迅速發(fā)展,在圖像分類、模式識別和視頻監(jiān)控等領(lǐng)域得到廣泛應(yīng)用。深度卷積神經(jīng)網(wǎng)絡(luò),作為深度學(xué)習(xí)的一種,在行人檢測中取得重大突破,識別率超過傳統(tǒng)技術(shù)。深度卷積神經(jīng)網(wǎng)絡(luò)由于其結(jié)構(gòu)的特殊性,能夠自動提取特征并進行識別,免去傳統(tǒng)技術(shù)中復(fù)雜的人工特征設(shè)計,因而傳統(tǒng)行人檢測技術(shù)被逐漸替代。
目前用于行人檢測的深度卷積神經(jīng)網(wǎng)絡(luò),主要有兩個方面改進:深度和寬度。通過增加網(wǎng)絡(luò)的深度,能夠提取出更加抽象的特征,進而得到更好的行人特征表示,如中國發(fā)明專利申請(申請?zhí)枺?01610315688.1,公開日:2016.10.12)“一種端到端的卷積神經(jīng)網(wǎng)絡(luò)的行人檢測方法”采用18層的網(wǎng)絡(luò)來構(gòu)建端到端的行人檢測框架,通過遷移VGG-16預(yù)訓(xùn)練參數(shù),使得網(wǎng)絡(luò)得到較好的檢測效果。增加網(wǎng)絡(luò)的寬度,能夠使得每一層的特征表示更加豐富,從而使得網(wǎng)絡(luò)具有更好的非線性表示能力。中國發(fā)明專利申請(申請?zhí)枺?01610954990.1,公開日:2017.4.19)“基于深度網(wǎng)絡(luò)的多尺度行人檢測方法”采用三列并聯(lián)網(wǎng)絡(luò)結(jié)構(gòu),將多尺度網(wǎng)絡(luò)進行合并,增加網(wǎng)絡(luò)深度的同時,充分挖掘圖像中不同尺寸行人的特征。
然而,隨著卷積神經(jīng)網(wǎng)絡(luò)深度和寬度的增加,網(wǎng)絡(luò)參數(shù)成指數(shù)倍增長,網(wǎng)絡(luò)訓(xùn)練的復(fù)雜度急劇增加,網(wǎng)絡(luò)規(guī)模和復(fù)雜度都在不斷變大,進而使得網(wǎng)絡(luò)參數(shù)越來越多并越來越大,這些最終導(dǎo)致運算所需要的硬件資源(內(nèi)存、GPU)越來越高,網(wǎng)絡(luò)運行占用的運算資源增大,所需的運算時間增加,這不利于卷積神經(jīng)網(wǎng)絡(luò)在運算條件受限的情況下進行應(yīng)用。例如對于車載系統(tǒng)實現(xiàn)行人檢測時,其儲存能力和運算能力有限,降低卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,提高卷積神經(jīng)網(wǎng)絡(luò)的運算效能,成為需要研究的重要問題。
總之,現(xiàn)有技術(shù)存在的問題是:基于卷積神經(jīng)網(wǎng)絡(luò)行人檢測時,從卷積神經(jīng)網(wǎng)絡(luò)中提取到的特征映射可能存在著冗余部分,這些冗余部分不但不能提高網(wǎng)絡(luò)性能,還可能降低行人檢測的正確率。基于卷積神經(jīng)網(wǎng)絡(luò)的行人檢測運算速度慢,并消耗大量的存儲與計算資源,影響行人檢測系統(tǒng)的整體效率,使得行人檢測難以達到實時監(jiān)測的現(xiàn)實需求。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于精簡卷積神經(jīng)網(wǎng)絡(luò)的行人檢測方法,通過基于卷積核相關(guān)性分析的卷積神經(jīng)網(wǎng)絡(luò)精簡方法,在保持網(wǎng)絡(luò)可訓(xùn)練性的同時,獲得更好的泛化能力,從而提高行人檢測的正確率。
實現(xiàn)本發(fā)明目的的技術(shù)解決方案為:
(10)數(shù)據(jù)集收集:將數(shù)據(jù)集圖像分為訓(xùn)練集圖像與測試集圖像;
(20)數(shù)據(jù)集圖像預(yù)處理:對數(shù)據(jù)集圖像進行尺寸變換、對比度歸一化和白化處理,得到低冗余數(shù)據(jù)灰度圖像;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍陸軍工程大學(xué),未經(jīng)中國人民解放軍陸軍工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810673838.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法及檢測裝置
- 數(shù)據(jù)處理裝置、圖像形成裝置以及系統(tǒng)
- 一種正電子發(fā)射斷層成像圖像數(shù)據(jù)集的方法和裝置
- 一種肺癌病理圖像數(shù)據(jù)集的構(gòu)建方法
- 用于可視化流動的使用機器學(xué)習(xí)的散斑對比度分析
- 一種基于深度學(xué)習(xí)的細胞圖像分析方法
- 圖像語義分割網(wǎng)絡(luò)訓(xùn)練方法、分割方法、分割裝置和介質(zhì)
- 人臉表情識別方法、系統(tǒng)、裝置及可讀存儲介質(zhì)
- 一種圖像數(shù)據(jù)增強方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 一種耕地圖像提取方法及系統(tǒng)
- 一種基于注意力引導(dǎo)的圖像可逆信息隱藏方法及系統(tǒng)





