[發(fā)明專利]一種多角度車型識別方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910044136.5 | 申請日: | 2019-01-17 |
| 公開(公告)號: | CN109902563A | 公開(公告)日: | 2019-06-18 |
| 發(fā)明(設(shè)計)人: | 蔡曉東;萬今朝 | 申請(專利權(quán))人: | 桂林遠望智能通信科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G08G1/017;G06N3/04 |
| 代理公司: | 北京輕創(chuàng)知識產(chǎn)權(quán)代理有限公司 11212 | 代理人: | 蔣杰 |
| 地址: | 541004 廣西壯族自治區(qū)*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積神經(jīng)網(wǎng)絡(luò) 預(yù)處理 車輛數(shù)據(jù)庫 測試樣本 車輛識別 車型識別 訓(xùn)練圖片 構(gòu)建 卷積 注意力機制 車輛圖片 分類識別 可分離 圖片 | ||
本發(fā)明公開了一種多角度車型識別方法及系統(tǒng),該方法包括以下步驟:收集多角度車輛圖片,構(gòu)建多角度車輛數(shù)據(jù)庫,進行預(yù)處理獲得多角度車輛訓(xùn)練圖片,未經(jīng)預(yù)處理的圖片作為測試樣本圖片;構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),在所述卷積神經(jīng)網(wǎng)絡(luò)中增加注意力機制,使用深度可分離卷積代替?zhèn)鹘y(tǒng)卷積;對所述多角度車輛訓(xùn)練圖片進行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,獲得多角度車輛識別模型;通過所述車輛識別模型對所述多角度車輛數(shù)據(jù)庫內(nèi)的所述測試樣本圖片進行分類識別。
技術(shù)領(lǐng)域
本發(fā)明涉及模式識別與圖像處理技術(shù)領(lǐng)域,具體的說,是一種多角度車型識別方法及系統(tǒng)。
背景技術(shù)
多角度車型識別是智能交通系統(tǒng)的重要組成部分之一,具有更加廣泛的應(yīng)用,包括智能停車系統(tǒng)、車輛流量的統(tǒng)計和車輛的檢測。隨著交通監(jiān)控攝像機的大量使用,車型識別在計算機視覺領(lǐng)域得到了極大的關(guān)注,在大型卷積神經(jīng)網(wǎng)絡(luò)提取高維度特征過程中,多角度計算復(fù)雜度較高且準確率相對較低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種多角度車型識別方法及系統(tǒng)。本發(fā)明為了解決現(xiàn)存問題,提供以下技術(shù)方案:
一種多角度車型識別方法,包括以下步驟:
收集多角度車輛圖片,構(gòu)建多角度車輛數(shù)據(jù)庫,進行預(yù)處理獲得多角度車輛訓(xùn)練圖片,未經(jīng)預(yù)處理的圖片作為測試樣本圖片;
構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),在所述卷積神經(jīng)網(wǎng)絡(luò)中增加注意力機制,使用深度可分離卷積代替?zhèn)鹘y(tǒng)卷積;
對所述多角度車輛訓(xùn)練圖片進行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,獲得多角度車輛識別模型;
通過所述車輛識別模型對所述多角度車輛數(shù)據(jù)庫內(nèi)的所述測試樣本圖片進行分類識別。
進一步,所述進行預(yù)處理獲取多角度車輛訓(xùn)練圖片,具體包括以下步驟:
將所述多角度車輛圖片剪裁成統(tǒng)一大小,以及對所述剪裁成統(tǒng)一大小的多角度車輛圖片進行旋轉(zhuǎn)和鏡像,得到數(shù)據(jù)增強后的樣本圖片;
將所述數(shù)據(jù)增強后的樣本圖片進行灰度化處理,得到多角度車輛訓(xùn)練圖片。
進一步,所述構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),在所述卷積神經(jīng)網(wǎng)絡(luò)中增加注意力機制,使用深度可分離卷積代替?zhèn)鹘y(tǒng)卷積,具體包括以下步驟:
構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),所述卷積神經(jīng)網(wǎng)絡(luò)包括數(shù)據(jù)輸入層、Resnet18網(wǎng)絡(luò)卷積層、特征層、全連接特征提取層、Drop_out層、全連接分類層和分類損失層;
在所述卷積神經(jīng)網(wǎng)絡(luò)中增加注意力機制結(jié)構(gòu),依次連接Conv1層、Conv2層、全局平均池化層、Fc1層、ReLU層、Fc2層、Sigmoid層,以及與所述Conv2層相連接的Scale層;
在所述卷積神經(jīng)網(wǎng)絡(luò)中,將傳統(tǒng)卷積核為3*3的卷積層替換成卷積核為3*3的深度卷積層和卷積核為1*1的逐點卷積層,所述深度卷積和逐點卷積合稱為深度可分離卷積,在1*1逐點卷積運算后,不使用ReLU激活函數(shù)。
進一步,所述注意力機制具體包括:
特征壓縮階段:使用所述全局平均池化層,將所述卷積層的每個通道的二維特征變成一個實數(shù),對所述二維特征進行壓縮;
特征激勵階段:使用一個全連接層,將輸入的所述二維特征的通道數(shù)降低,減少通道的個數(shù),降低計算量;連接ReLU激活函數(shù),保持輸出維度不變,得到非線性特征;再通過一個全連接層變回原來的維度,經(jīng)過Sigmoid函數(shù)將特征權(quán)重歸一化到0-1之間;
特征重標定階段:使用所述縮放層對每個所述二維特征的通道的權(quán)重進行重新標定,將所述二維特征激勵操作后輸出的權(quán)重加權(quán)到每個所述通道的二維特征上,以此完成對原始二維特征的重新標定。
進一步,所述深度可分離卷積用于計算復(fù)雜度,所述深度可分離卷積計算復(fù)雜度具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于桂林遠望智能通信科技有限公司,未經(jīng)桂林遠望智能通信科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910044136.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標檢測方法及檢測裝置





