[發(fā)明專利]一種基于改進(jìn)的DSOD模型的車輛檢測與識(shí)別方法在審
| 申請?zhí)枺?/td> | 201910366444.X | 申請日: | 2019-05-05 |
| 公開(公告)號(hào): | CN110232316A | 公開(公告)日: | 2019-09-13 |
| 發(fā)明(設(shè)計(jì))人: | 蔣洋濤;馮濤 | 申請(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/46;G06K9/62;G06N3/04 |
| 代理公司: | 浙江永鼎律師事務(wù)所 33233 | 代理人: | 陸永強(qiáng) |
| 地址: | 310018*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 車輛檢測 子網(wǎng)絡(luò) 兩層 提取圖像特征 改進(jìn) 目標(biāo)預(yù)測 前端檢測 特征提取 主干模塊 邊界框 過渡層 檢測 池化 | ||
本發(fā)明公開了一種基于改進(jìn)的DSOD模型的車輛檢測與識(shí)別方法,DSOD是在SSD算法的基礎(chǔ)上進(jìn)行改進(jìn)的,可以簡單理解為SSD+DenseNet=DSOD,采用proposal?free的檢測模型SSD,加入DenseNet的思想。DSOD模型分成兩個(gè)部分:用于特征提取的Backbone,用于目標(biāo)預(yù)測的Front?end。Backbone子網(wǎng)絡(luò)類似于DenseNet,由一層Stem block(主干模塊),四層Dense blocks(Dense模塊),兩層Transition layers(過渡層),兩層Transition w/o pooling layers(過渡w/o池化層),作用是用來提取圖像特征。Front_end sub_network(前端檢測子網(wǎng)絡(luò))是通過Dense Connetion實(shí)現(xiàn)邊界框檢測效果。
技術(shù)領(lǐng)域
本發(fā)明涉及交通圖像處理技術(shù)領(lǐng)域,尤其涉及一種基于改進(jìn)的DSOD模型的車輛檢測與識(shí)別方法。
背景技術(shù)
隨著國民經(jīng)濟(jì)發(fā)展和人工智能技術(shù)的發(fā)展,智能駕駛汽車領(lǐng)域獲得了空前的大發(fā)展。目標(biāo)檢測是智能駕駛汽車環(huán)境識(shí)別感知的關(guān)鍵一環(huán),對(duì)道路前方目標(biāo)車輛檢測有助于做出安全準(zhǔn)確的駕駛決策指令。日常駕駛場景下計(jì)算機(jī)視覺的目標(biāo)檢測任務(wù)中,道路情況相當(dāng)復(fù)雜,各種大小行駛的車輛,車輛相互遮擋情況,晴雨天光照的變化等不利因素都影響著車輛目標(biāo)檢測效果的準(zhǔn)確性。在目標(biāo)檢測領(lǐng)域中,傳統(tǒng)的人工標(biāo)注正、負(fù)樣本方式制作訓(xùn)練樣本成本比較高昂,使用HOG(Histogram of Oriented Gradient,方向梯度直方圖)或Haar等人工特征進(jìn)行圖像的特征提取,再使用SVM(Support Vector Machine,支持向量機(jī))來判別。但是花費(fèi)了大量人力、物力制作訓(xùn)練的樣本庫訓(xùn)練出的分類識(shí)別效果不一定滿足產(chǎn)品要求。而通過深度學(xué)習(xí)方法,尤其是深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional NeuralNetworks,DCNN)的出現(xiàn)打破了圖像語義表達(dá)的局限,通過豐富的特征表達(dá)信息進(jìn)行匹配、評(píng)估和分類。比較有代表性的方法:R-CNN(Region-CNN)方法是利用選擇性搜索(SelectiveSearch,SS)算法評(píng)測相鄰圖像子塊的特征相似度,通過合并打分的候選框輸入到卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)部的分類器進(jìn)行特征向量分類,達(dá)到目標(biāo)檢測定位的目的。Fast R-CNN方法則是設(shè)計(jì)一種RoI Pooling的池化層結(jié)構(gòu),解決將圖像區(qū)域剪裁、縮放到相同尺寸大小的操作,仍然沒有擺脫選擇性搜索算法生成正負(fù)樣本候選框的問題。Faster R-CNN方法屬于兩級(jí)檢測,使用區(qū)域生成網(wǎng)絡(luò)(Region Proposal Networks,RPN)來提取大量候選區(qū)域,對(duì)其進(jìn)行分類和回歸,得出目標(biāo)的位置定位,但由于運(yùn)算速度過慢,且內(nèi)存消耗龐大。YOLO(Youonly look once,YOLO)方法屬于一級(jí)檢測,使用7*7的網(wǎng)絡(luò)進(jìn)行端對(duì)端的回歸計(jì)算,預(yù)測每個(gè)網(wǎng)格內(nèi)的邊框坐標(biāo)和每個(gè)類別置信度將目標(biāo)的分類和定位合并處理,檢測速度指標(biāo)雖較快,但是簡單的網(wǎng)絡(luò)回歸運(yùn)算檢測精度并不高。SSD(Single Shot MultiBox Detector,SSD)也是端到端的算法,引入不同卷積層檢測結(jié)構(gòu)預(yù)測,提升多尺度和多比例的檢測能力,但低層特征語義信息的缺失導(dǎo)致小目標(biāo)檢測能力比較弱。
發(fā)明內(nèi)容
為了克服上述背景技術(shù)所存在的不足,以及必須要通過在ImageNet分類任務(wù)上預(yù)訓(xùn)練的模型作為初始權(quán)重,本發(fā)明提供一種基于改進(jìn)的DSOD模型的車輛檢測與識(shí)別方法,本發(fā)明提供了一種從0開始訓(xùn)練的檢測模型,而不是微調(diào)一個(gè)預(yù)訓(xùn)練的模型,并通過FocalLoss代替Softmax Loss降解目標(biāo)檢測過程中損失,即能準(zhǔn)確地實(shí)現(xiàn)目標(biāo)檢測,又能提升模型結(jié)構(gòu)的靈活性、學(xué)習(xí)偏置差異問題和問題域的不匹配。本發(fā)明能夠?qū)Φ缆非闆r下汽車駕駛場景下的目標(biāo)有效檢測。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
步驟S1:通過KITTI公開數(shù)據(jù)集的車輛行駛視頻圖像安數(shù)據(jù),并對(duì)訓(xùn)練數(shù)據(jù)集數(shù)據(jù)進(jìn)行預(yù)處理;
步驟S2:以TensorFlow框架為基礎(chǔ),使用python編程語言搭建DSOD網(wǎng)絡(luò)模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910366444.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種微電網(wǎng)電磁暫態(tài)實(shí)時(shí)仿真的方法及系統(tǒng)
- 網(wǎng)絡(luò)切片子網(wǎng)的選擇方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)切片的管理方法及系統(tǒng)和存儲(chǔ)介質(zhì)
- 用于雙向網(wǎng)絡(luò)地理信息傳送的系統(tǒng)、方法及設(shè)備
- 多跳異構(gòu)無線網(wǎng)絡(luò)中多任務(wù)路由的方法、網(wǎng)絡(luò)及節(jié)點(diǎn)
- 基于高精度神經(jīng)網(wǎng)絡(luò)的圖像處理方法、裝置及電子設(shè)備
- 一種前向耗時(shí)的確定方法、裝置及設(shè)備
- 超網(wǎng)絡(luò)參數(shù)更新方法、裝置和電子設(shè)備
- 一種基于網(wǎng)絡(luò)分解的大規(guī)模橋梁網(wǎng)絡(luò)連通概率評(píng)估方法
- 電信網(wǎng)絡(luò)





