[發(fā)明專利]基于參數(shù)壓縮的卷積神經(jīng)網(wǎng)絡交通標志識別方法在審
| 申請?zhí)枺?/td> | 201711042226.8 | 申請日: | 2017-10-31 |
| 公開(公告)號: | CN107644221A | 公開(公告)日: | 2018-01-30 |
| 發(fā)明(設(shè)計)人: | 宋佳蓉;楊忠;胡國雄;韓家明;張?zhí)煲?/a>;朱家遠 | 申請(專利權(quán))人: | 南京航空航天大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 南京經(jīng)緯專利商標代理有限公司32200 | 代理人: | 姜慧勤 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 參數(shù) 壓縮 卷積 神經(jīng)網(wǎng)絡 交通標志 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及基于參數(shù)壓縮的卷積神經(jīng)網(wǎng)絡交通標志識別方法,屬于模式識別技術(shù)領(lǐng)域。
背景技術(shù)
隨著自動駕駛概念的提出與發(fā)展,作為其中重要研究部分之一的交通標志的識別也得到了研究者大量的關(guān)注與研究。然而,大多采用傳統(tǒng)視覺算法的交通標志識別技術(shù)一般都是通過輪廓提取、目標分割,再利用模板匹配技術(shù)來對交通標志進行識別,此方法在復雜背景下或者噪聲嚴重時很難有好的表現(xiàn)。而近年來,隨著深度學習的發(fā)展特別是卷積神經(jīng)網(wǎng)絡在計算機視覺中的大量應用,結(jié)合卷積神經(jīng)網(wǎng)絡的交通標志識別方法得到了許多關(guān)注與應用。
申請?zhí)枮?01510002850.X的《一種基于多分辨率卷積神經(jīng)網(wǎng)絡的交通標志識別方法》,采用兩個相同結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡陣對不同分辨率的二維圖像進行特征提取和識別。該方法需要兩個卷積網(wǎng)絡,因而加大了網(wǎng)絡參數(shù),對存儲容量要求較高,且難以在小內(nèi)存設(shè)備上運行。
申請?zhí)枮?01710122736.X的《一種基于圖像顯著性和深度學習的交通道路標志識別方法》,首先用一個卷積網(wǎng)絡生成另外一個網(wǎng)絡,接著訓練生成的新網(wǎng)絡。然后再將測試圖片進行顯著性并輸出分類網(wǎng)絡,最后得出識別結(jié)果。此方法網(wǎng)絡結(jié)構(gòu)復雜,參數(shù)量大,容易造成過擬合且對存儲容量要求較高。
申請?zhí)枮?01610709259.2的《一種基于深度學習的公路交通標志自動識別與管理系統(tǒng)》,首先通過卷積網(wǎng)絡選定輸入圖片的候選區(qū)域,再將候選區(qū)域輸入另外的卷積網(wǎng)絡,最后識別幾交通標志類別及在圖像中的位置。此方法網(wǎng)絡結(jié)構(gòu)復雜,且對于識別而言,位置信息并非必要信息。因此該結(jié)構(gòu)網(wǎng)絡依然具有參數(shù)量大,對存儲容量要求較高且實時性不強。
綜上所述,雖然國內(nèi)外對基于卷積神經(jīng)網(wǎng)絡的交通標志識別有較多研究,但大都存在著網(wǎng)絡參數(shù)過多的問題,故對存儲器容量和運行內(nèi)存有較高要求。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是:提供基于參數(shù)壓縮的卷積神經(jīng)網(wǎng)絡交通標志識別方法,在不降低網(wǎng)絡識別準確率的前提條件下,盡可能減小網(wǎng)絡參數(shù),從而降低網(wǎng)絡對存儲器容量和運行內(nèi)存的要求,使網(wǎng)絡可以在嵌入式設(shè)備上實時運行。
本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案:
基于參數(shù)壓縮的卷積神經(jīng)網(wǎng)絡交通標志識別方法,包括如下步驟:
步驟1,獲取四種類型的原始交通標志圖像,包括限速標志、禁止停車標志、前方有學校標志、紅綠燈標志;
步驟2,利用數(shù)據(jù)增強方法擴充步驟1獲取的四種類型的原始交通標志圖像;
步驟3,對擴充后的圖像進行預處理;
步驟4,構(gòu)建卷積神經(jīng)網(wǎng)絡,并對卷積神經(jīng)網(wǎng)絡進行初始化,將預處理后的圖像送入卷積神經(jīng)網(wǎng)絡進行有監(jiān)督訓練,得到具有交通標志識別功能的卷積神經(jīng)網(wǎng)絡,利用具有交通標志識別功能的卷積神經(jīng)網(wǎng)絡對交通標志進行識別;
所述卷積神經(jīng)網(wǎng)絡包括卷積層、單通道取均值層、全連接層和分類器;其中卷積層包括第一卷積層、第二卷積層、第一下采樣層、第三卷積層、第四卷積層、第二下采樣層、第五卷積層、第六卷積層、第七卷積層、第八卷積層以及第三下采樣層。
作為本發(fā)明的一種優(yōu)選方案,步驟2所述數(shù)據(jù)增強方法具體包括以下三種操作:對圖像進行鏡像操作、小尺度旋轉(zhuǎn)操作、模糊操作。
作為本發(fā)明的一種優(yōu)選方案,步驟3所述預處理具體包括尺度歸一化操作和像素減均值操作。
作為本發(fā)明的一種優(yōu)選方案,步驟4所述卷積神經(jīng)網(wǎng)絡包括卷積層、單通道取均值層、全連接層和分類器,具體如下:
卷積層:第一卷積層采用96個7×7×3大小的濾波器,步長為2;采用96個5×5×96大小的濾波器,步長為2,填充為1;第一下采樣層濾波器的大小為3×3,步長為2;第三卷積層采用256個為3×3×96大小的濾波器,填充為1;第四卷積層采用256個為3×3×256大小的濾波器,填充為1;第二下采樣層濾波器的大小為3×3,步長為2;第五卷積層采用256個為3×3×256大小的濾波器,填充為1;第六卷積層采用384個3×3×256大小的濾波器,填充為1;第七卷積層采用384個3×3×384大小的濾波器,填充為1;第八卷積層采用256個3×3×384大小的濾波器,填充為1;第三下采樣層濾波器的大小為3×3;
單通道取均值層:經(jīng)過第三下采樣層后輸出圖像大小為11×11×256,采用單通道取均值后,輸出大小為1×1×256,即256個神經(jīng)元;
全連接層:采用256×1-dropout-4096×1結(jié)構(gòu);
分類器:采用softmax分類器實現(xiàn)多分類輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京航空航天大學,未經(jīng)南京航空航天大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711042226.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:移動終端保護膜及移動終端
- 下一篇:控制電子終端的方法及設(shè)備
- 同類專利
- 專利分類
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡及基于卷積神經(jīng)網(wǎng)絡的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)





