[發(fā)明專利]一種基于視頻圖像的危化品運輸車輛檢測與識別方法有效
| 申請?zhí)枺?/td> | 201810541843.0 | 申請日: | 2018-05-30 |
| 公開(公告)號: | CN108875803B | 公開(公告)日: | 2022-06-17 |
| 發(fā)明(設計)人: | 惠飛;景首才;宋歡歡 | 申請(專利權)人: | 長安大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06K9/62 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 徐文權 |
| 地址: | 710064 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視頻 圖像 危化品 運輸 車輛 檢測 識別 方法 | ||
1.一種基于視頻圖像的危化品運輸車輛檢測與識別方法,其特征在于,包括如下步驟:
步驟1,檢測包含目標車輛的單幀圖像,通過單幀圖像對目標車輛進行粗分類,并確定目標車輛在圖像中的位置;
步驟2,根據(jù)目標車輛在圖像中的位置,對目標車輛進行細分類,得到圖像中目標車輛的識別信息,根據(jù)目標車輛的識別信息對目標車輛進行識別;
步驟1具體包括如下步驟:
步驟1.1,將包含目標車輛的單幀圖像放入深度殘差網(wǎng)絡ResNet50,得到每張圖像的特征圖Q,特征圖Q包含5個層級;
步驟1.2,將特征圖Q放入特征金字塔網(wǎng)絡,得到每張圖像的特征圖W,特征圖W包含5個層級;
步驟1.3,通過區(qū)域推薦網(wǎng)絡算法,對特征圖W生成一系列錨框,每個錨框攜帶一個長度為K的one-hot向量,以及一個4維的邊框坐標信息,其中,錨框的個數(shù)為A,K的長度是A;
步驟1.4,針對每個錨框,根據(jù)特征金字塔網(wǎng)絡的層級的大小,從任意一個層級取得該層級對應通道的特征圖,再將取得的通道的特征圖經(jīng)過卷積神經(jīng)網(wǎng)絡的卷積層進行處理,再采用ReLu激勵函數(shù)進行處理,然后,再對ReLu激勵函數(shù)處理后的結(jié)果連接一個包含K×A個3*3卷積核的卷積層,最終預測出每張圖片中車輛的分類情況,完成車輛的粗分類;
并且,針對步驟1.3產(chǎn)生的每個錨框,使每個錨框經(jīng)過全卷積網(wǎng)絡,獲得錨框和標定框的相對偏移坐標,通過相對偏移坐標確定車輛在圖像中的位置;
對步驟1.1至步驟1.4進行數(shù)據(jù)的訓練,數(shù)據(jù)訓練時采用的損失函數(shù)FL(pt)如下:
FL(pt)=-αt(1-pt)γlog(pt)
其中,γ是一個預設參數(shù),γ≥0,pt的定義如下式:
其中,y表示人工輸入的車輛的標簽,1代表的是危化品運輸車輛;p表示車輛粗分類時預測圖像屬于1的概率;
αt的定義如下式:
其中,y表示人工輸入的車輛的標簽,1代表的是危化品運輸車輛,α是一個預設參數(shù),0<α<1;
步驟2具體包括如下步驟:
步驟2.1,根據(jù)目標車輛在圖像中的位置,然后對圖像進行變換和裁剪,裁剪得到的圖像包含目標車輛區(qū)域且為正方形;
步驟2.2,再使用卷積神經(jīng)網(wǎng)絡D對裁剪后的圖像中目標車輛外部部位的位置進行特征提取,得到包含目標車輛外部部位位置的特征A1;
步驟2.3,對于步驟2.2提取的目標車輛的外部部位,再使用卷積神經(jīng)網(wǎng)絡E對裁剪后的圖像進行特征提取,得到包含目標車輛外部部位位置的特征B1,卷積神經(jīng)網(wǎng)絡D與卷積神經(jīng)網(wǎng)絡E不同;
步驟2.4,將特征A1和特征B1使用矩陣外積進行組合,再采用最大值池化的方法形成與裁剪得到的圖像對應的雙線性特征向量;
步驟2.5,根據(jù)步驟2.4所得到的雙線性特征向量,使用Softmax分類器進行車輛的細分類,得到車輛種類,實現(xiàn)對目標車輛的識別。
2.根據(jù)權利要求1所述的一種基于視頻圖像的危化品運輸車輛檢測與識別方法,其特征在于,步驟1.2中,標記特征圖Q的5個層級分別為C1、C2、C3、C4和C5,標記特征圖W的5個層級分別為P3、P4、P5、P6和P7,C1經(jīng)過特征金字塔網(wǎng)絡得到P3,C2經(jīng)過特征金字塔網(wǎng)絡得到P4,C3經(jīng)過特征金字塔網(wǎng)絡得到P5,C4經(jīng)過特征金字塔網(wǎng)絡得到P6,C5經(jīng)過特征金字塔網(wǎng)絡得到P7。
3.根據(jù)權利要求1所述的一種基于視頻圖像的危化品運輸車輛檢測與識別方法,其特征在于,步驟1.3中,錨框在特征圖W的5個層級上的像素大小分別為32*32,64*64,128*128,256*256,512*512。
4.根據(jù)權利要求1所述的一種基于視頻圖像的危化品運輸車輛檢測與識別方法,其特征在于,步驟1.4中,采用Sigmoid函數(shù)來對目標車輛進行粗分類。
5.根據(jù)權利要求1所述的一種基于視頻圖像的危化品運輸車輛檢測與識別方法,其特征在于,步驟2.1中,對圖像變換采用圖像隨機翻轉(zhuǎn)、隨機切割或反復變換的方式。
6.根據(jù)權利要求1所述的一種基于視頻圖像的危化品運輸車輛檢測與識別方法,其特征在于,所述包含目標車輛的單幀圖像為由原始交通視頻所得的單幀圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長安大學,未經(jīng)長安大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810541843.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





