[發(fā)明專利]一種基于深度學習的車輛檢測與識別的方法有效
| 申請?zhí)枺?/td> | 202010347978.0 | 申請日: | 2020-04-28 |
| 公開(公告)號: | CN111582339B | 公開(公告)日: | 2023-07-25 |
| 發(fā)明(設計)人: | 樊寬剛;李娜;陳宇航;楊杰;楊斌 | 申請(專利權)人: | 江西理工大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京科億知識產(chǎn)權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 341000 *** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 車輛 檢測 識別 方法 | ||
1.一種基于深度學習的車輛檢測與識別的方法,其特征在于,包括如下步驟:
S1、采集原始車輛圖片數(shù)據(jù);
S2、制作原始訓練數(shù)據(jù)集;
S3、對步驟S2得到的原始訓練數(shù)據(jù)集進行數(shù)據(jù)增強,形成最終訓練數(shù)據(jù)集:
先對原始訓練數(shù)據(jù)集依次進行亮度隨機調整、對比度隨機調整、色相隨機調整、飽和度隨機調整、通道隨機調換光學變換,再依次進行隨機擴展、隨機剪裁、隨機鏡像、隨機到固定比例幾何變換,最后進行去均值變換,得到最終訓練數(shù)據(jù)集;
S4、對Faster?RCNN網(wǎng)絡模型進行改進,改進的內容包括:
1)對Faster?RCNN網(wǎng)絡模型的共享卷積網(wǎng)絡VGGNet-16進行改進:
將共享卷積網(wǎng)絡VGGNet-16的第3層到第13層的3×3卷積修改為Fire?Module;
2)在原有的Faster?RCNN網(wǎng)絡模型的RPN網(wǎng)絡的基礎上增加6個更小的anchors,即Faster?RCNN網(wǎng)絡模型在特征圖的每一像素點上抽取15種Anchors,具體尺度為(1282、2562、5122、322、642)和3類長寬比(1:1,2:1,1:2);
3)用ROI?Align代替原有的Faster?RCNN網(wǎng)絡模型中的ROI?Pooling;
4)采用多尺度訓練作為Faster?RCNN網(wǎng)絡模型的訓練方式;
S5、利用步驟S3得到的最終訓練數(shù)據(jù)集對步驟S4得到的改進后的Faster?RCNN網(wǎng)絡模型進行訓練;
S6、把需要檢測的車輛圖像輸入訓練后的預測模型中,得到車輛檢測結果。
2.根據(jù)權利要求1所述的基于深度學習的車輛檢測與識別的方法,其特征在于,步驟S2的具體過程如下:
S2.1、下載VOC2007數(shù)據(jù)集,并將步驟S1采集得到的原始車輛圖片數(shù)據(jù)移動到VOC2007數(shù)據(jù)集的data文件夾下;
S2.2、使用標注工具對原始車輛圖片數(shù)據(jù)進行標注,用矩形框框出原始車輛圖片中的車輛,并生成xml文件,xml文件保存矩形框坐標和車輛類型,保存格式為[車輛類型,矩形框中心x坐標,矩形框中心y坐標,車輛寬度w,車輛高度h];刪除難以人工標注的原始車輛圖片;將得到的xml文件替換VOC2007數(shù)據(jù)集中Annotations文件夾內的文件;
S2.3、根據(jù)步驟S2.2生成的xml文件,對應生成名稱為train、test、trainval和val的txt文件,用這四個txt文件替換VOC2007數(shù)據(jù)集中Main文件夾內的txt文件;
S2.4、初始化模型參數(shù),下載預訓練模型將其放在data文件夾下。
3.根據(jù)權利要求1所述的基于深度學習的車輛檢測與識別的方法,其特征在于,所述多尺度訓練中,設置三種輸入尺度(600,800,1000),訓練時,每張車輛圖片被隨機分配一種尺度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西理工大學,未經(jīng)江西理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010347978.0/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





