[發明專利]一種多角度車型識別方法及系統在審
| 申請號: | 201910044136.5 | 申請日: | 2019-01-17 |
| 公開(公告)號: | CN109902563A | 公開(公告)日: | 2019-06-18 |
| 發明(設計)人: | 蔡曉東;萬今朝 | 申請(專利權)人: | 桂林遠望智能通信科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G08G1/017;G06N3/04 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 蔣杰 |
| 地址: | 541004 廣西壯族自治區*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 預處理 車輛數據庫 測試樣本 車輛識別 車型識別 訓練圖片 構建 卷積 注意力機制 車輛圖片 分類識別 可分離 圖片 | ||
1.一種多角度車型識別方法,其特征在于,所述方法包括以下步驟:
收集多角度車輛圖片,構建多角度車輛數據庫,進行預處理獲得多角度車輛訓練圖片,未經預處理的圖片作為測試樣本圖片;
構建卷積神經網絡,在所述卷積神經網絡中增加注意力機制,使用深度可分離卷積代替傳統卷積;
對所述多角度車輛訓練圖片進行卷積神經網絡訓練,獲得多角度車輛識別模型;
通過所述車輛識別模型對所述多角度車輛數據庫內的所述測試樣本圖片進行分類識別。
2.根據權利要求1所述的方法,其特征在于,所述進行預處理獲取多角度車輛訓練圖片,具體包括以下步驟:
將所述多角度車輛圖片剪裁成統一大小,以及對所述剪裁成統一大小的多角度車輛圖片進行旋轉和鏡像,得到數據增強后的樣本圖片;
將所述數據增強后的樣本圖片進行灰度化處理,得到多角度車輛訓練圖片。
3.根據權利要求1所述的方法,其特征在于,所述構建卷積神經網絡,在所述卷積神經網絡中增加注意力機制,使用深度可分離卷積代替傳統卷積,具體包括以下步驟:
構建卷積神經網絡,所述卷積神經網絡包括數據輸入層、Resnet18網絡卷積層、特征層、全連接特征提取層、Drop_out層、全連接分類層和分類損失層;
在所述卷積神經網絡中增加注意力機制結構,依次連接Conv1層、Conv2層、全局平均池化層、Fc1層、ReLU層、Fc2層、Sigmoid層,以及與所述Conv2層相連接的Scale層;
在所述卷積神經網絡中,將傳統卷積核為3*3的卷積層替換成卷積核為3*3的深度卷積層和卷積核為1*1的逐點卷積層,所述深度卷積和逐點卷積合稱為深度可分離卷積,在1*1逐點卷積運算后,不使用ReLU激活函數。
4.根據權利要求1或3所述的方法,其特征在于,所述注意力機制具體包括:
特征壓縮階段:使用所述全局平均池化層,將所述卷積層的每個通道的二維特征變成一個實數,對所述二維特征進行壓縮;
特征激勵階段:使用一個全連接層,將輸入的所述二維特征的通道數降低,減少通道的個數,降低計算量;連接ReLU激活函數,保持輸出維度不變,得到非線性特征;再通過一個全連接層變回原來的維度,經過Sigmoid函數將特征權重歸一化到0-1之間;
特征重標定階段:使用所述縮放層對每個所述二維特征的通道的權重進行重新標定,將所述二維特征激勵操作后輸出的權重加權到每個所述通道的二維特征上,以此完成對原始二維特征的重新標定。
5.根據權利要求1或3所述的方法,其特征在于,所述深度可分離卷積用于計算復雜度,所述深度可分離卷積計算復雜度具體包括:
深度可分離卷積首先是一組二維的卷積核,其中卷積核的通道數為1,每次只處理一個輸入通道,其中二維卷積核的數量與輸入通道數一樣。逐個卷積處理之后,使用三維1×1的卷積核來處理之前輸出的特征圖,最終輸出的通道數變成了一個指定的數量。一組與通道數相同的二維卷積核的計算量為:
Dk×Dk×M×Df×Df
三維1×1卷積核的計算量為:
N×M×Df×Df
所以使用深度可分離卷積總的計算量為:
Dk×Dk×M×Df×Df+N×M×Df×Df
因此使用深度可分離卷積與傳統卷積的計算量之比為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林遠望智能通信科技有限公司,未經桂林遠望智能通信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910044136.5/1.html,轉載請聲明來源鉆瓜專利網。





