[發明專利]一種基于深度學習的車輛品牌型號識別方法有效
| 申請號: | 201510744974.5 | 申請日: | 2015-11-30 |
| 公開(公告)號: | CN105488517B | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 曾凡濤 | 申請(專利權)人: | 杭州全實鷹科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 浙江永鼎律師事務所 33233 | 代理人: | 郭小麗 |
| 地址: | 310030 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 車輛 品牌 型號 識別 方法 | ||
1.一種基于深度學習的車輛品牌型號識別方法,其特征在于,包括以下步驟:
S1、準備數據集:不同城市的高清卡口點位搜集準備了2000多萬張抓拍圖片,經過人工篩選,根據車輛的品牌型號精確分成三千多類,建立豐富的涵蓋各種條件的車輛品牌型號圖片數據庫,然后再利用車牌識別技術精確定位卡口圖片中的車牌位置,根據車牌位置信息準確估計車臉區域,再將車臉區域圖像進行尺度歸一化處理;
S2、針對車輛品牌型號的識別任務設計一種新的深度卷積網絡結構,深度卷積網絡由1個輸入層,4個卷積層,4個下采樣層,2個全連接層和1個輸出層組成,其中,4個卷積層分別用C1、C2、C3、C4來表示,其中C1和C2為全局共享卷積核的卷積層用于提取全局圖像特征,C3和C4為局部共享卷積核的卷積層用于提取局部圖像特征以增強不同類型的車輛之間的區分度;4個下采樣層分別用P1、P2、P3、P4來表示,2個全連接層分別用F1、F2來表示,1個輸出層用SoftMax來表示;
其中,輸入層為200x80的單通道灰度圖像;C1層全局共享的卷積核大小為5x5,步長為1,卷積核數量為30個,卷積后的特征尺度為196x76;P1層采樣窗口為3,步長為3,采樣后的特征數量為30個,特征尺度為66x26;C2層全局共享的卷積核大小為3x3,步長為1,卷積核數量為60個,卷積后的特征尺度為64x24;P2層采樣窗口為2,步長為2,采樣后的特征數量為60個,特征尺度為32x12;C3層采用了局部共享卷積核的策略,將P2層的輸出特征分為了4個16x6,每一個子區域共享3x3的卷積核,卷積核的數量為100個,這樣得到的特征尺度為4個14x4的子特征,整個特征尺度為28x8;P3層采用了2x2的采樣窗口,步長為2,采樣后的特征數量為100個,特征尺度為14x4;C4層同樣采用了局部共享權值的策略,將P3層的輸出特征分為了2個8x4的子區域,其中兩個子區域存在2x4的兩列重疊區域,每一個子區域共享3x3的卷積核,卷積核的數量為150,這樣得到的特征為2個6x2的子特征,特征尺度為12x2;P4層的采樣窗口為2,步長為2,采樣后的特征尺度為6x1,數量為150;為了增加特征的描述能力,將P3層和P4層兩個不同尺度的所有特征聯合拼接起來作為F1層向后繼續傳遞,這樣F1層的神經元個數為6500,這樣的高維特征中存在冗余信息,為了降低特征的維度F1后面接入了F2層,F2層的神經元個數為3000;網絡的最后層為SoftMax,計算每一個輸入樣本隸屬于每一類車輛的概率,概率最大的類別即為樣本所屬的車輛型號,深度卷積網絡結構中只有卷積層和全連接層使用了激活函數;
S3、訓練深度卷積網絡,得到每個層的網絡權值;
S4、利用深度卷積網絡提取車臉區域的圖像特征,
將車臉區域圖像輸入到深度卷積網絡結構中,計算出的F1層和F2層結果均可作為車型識別的特征輸入,F1層特征維度較高,稀疏程度較高,存在較多的冗余信息,F2層是F1層經過降維后的特征,保留了區分度較高特征部分,能更好地描述車臉區域,采用F2層的輸出作為最終用于識別的特征描述子;
S5、將深度卷積網絡提取的特征輸入到支撐向量機,完成車輛品牌型號的識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州全實鷹科技有限公司,未經杭州全實鷹科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510744974.5/1.html,轉載請聲明來源鉆瓜專利網。





