[發明專利]一種基于改進的DSOD模型的車輛檢測與識別方法在審
| 申請號: | 201910366444.X | 申請日: | 2019-05-05 |
| 公開(公告)號: | CN110232316A | 公開(公告)日: | 2019-09-13 |
| 發明(設計)人: | 蔣洋濤;馮濤 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04 |
| 代理公司: | 浙江永鼎律師事務所 33233 | 代理人: | 陸永強 |
| 地址: | 310018*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 車輛檢測 子網絡 兩層 提取圖像特征 改進 目標預測 前端檢測 特征提取 主干模塊 邊界框 過渡層 檢測 池化 | ||
1.一種基于改進的DSOD模型的車輛檢測與識別方法,其特征在于,該方法包括以下步驟:
步驟S1:采用KITTI公開數據集的車輛行駛視頻圖像,并對訓練數據集數據進行預處理;
步驟S2:以TensorFlow框架為基礎,使用Python編程語言搭建DSOD網絡模型;
步驟S3:網絡初始化,直接丟棄使用預訓練模型來訓練現有的數據集,通過訓練數據集的迭代訓練更新相關權重值;
步驟S4:網絡初始化,直接丟棄使用預訓練模型來訓練現有的數據集,通過訓練數據集的迭代訓練更新相關權重值;
步驟S5:通過汽車上的攝像機采集的道路上前方的圖像,輸入到網絡進行檢測,即可輸出目標檢測后的類別及坐標,從而達到目標檢測功能;
其中,改進的DSOD網絡模型采用proposal-free的檢測模型SSD,并加入DenseNet的思想,不需要預訓練;
所述DSOD網絡模型分成兩個部分:用于特征提取的Backbone和用于目標預測的Front-end;Backbone子網絡類似于DenseNet,由一層Stem block(主干模塊),四層Dense blocks(Dense模塊),兩層Transition layers(過渡層),兩層Transition w/o pooling layers(過渡w/o池化層),作用是用來提取圖像特征;Front_end子網絡通過Dense Connetion實現邊界框檢測效果;
所述步驟進一步S3包括:
步驟S31:原始圖像讀取進來,經過6種不同scale的特征,特征映射來自骨干子網的中間層;
步驟S32:一個具有瓶頸結構的平滑過渡層(1*1卷積層用于減少特征映射的數量加上在兩個連續的之間采用3*3轉換層特征圖的比例;
步驟S33:每個虛線框內都有一個1*1的卷積和一個3*3的卷積操作,相當于一個bottleneck;
步驟S34:每個bottleneck的輸入是前面所有bottleneck的輸出的級聯操作結果,即一半的特征圖是從先前的尺度中學習的,而其余的則是半特征映射從連續的高分辨率特征映射中直接下采樣;
所述步驟S32進一步包括:
步驟S321:原始圖像另一條并行處理的線是downsampling block,其中包括2*2 maxpooling,stride=2和一個1*1,stride=1 conv;
步驟S322:匯集層旨在在連接期間將分辨率與當前大小匹配,1*1轉換層用于減少數量渠道達到50%;匯集層位于之前考慮降低計算成本,1*1轉換層的下采樣塊實際上帶來了每個使用來自其所有的多分辨率特征映射進行縮放先前的尺度;
所述步驟S4進一步包括:
步驟S41:引入了Focal Loss替代Softmax Loss;
步驟S42:調整loss的計算公式使單級結構在訓練初始階段提高positive的分類概率,根據正負樣本計算的損失,然后反向傳播迭代訓練,直至對道路情況下汽車駕駛場景下的目標檢測的準確性和穩定性達到預計要求。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910366444.X/1.html,轉載請聲明來源鉆瓜專利網。





