[發(fā)明專利]一種基于改進(jìn)YOLO v3算法的遠(yuǎn)距離交通標(biāo)志檢測方法在審
| 申請?zhí)枺?/td> | 202011159601.9 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112257793A | 公開(公告)日: | 2021-01-22 |
| 發(fā)明(設(shè)計)人: | 王宇新;王云富;李顏 | 申請(專利權(quán))人: | 大連理工大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 大連理工大學(xué)專利中心 21200 | 代理人: | 李曉亮;潘迅 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) yolo v3 算法 遠(yuǎn)距離 交通標(biāo)志 檢測 方法 | ||
1.一種基于改進(jìn)YOLO v3算法的遠(yuǎn)距離交通標(biāo)志檢測方法,其特征在于,包括以下步驟:
步驟1:數(shù)據(jù)采集及預(yù)處理
采集遠(yuǎn)距離場景下包含各種交通標(biāo)志的圖像數(shù)據(jù),圖像數(shù)據(jù)包含的交通標(biāo)志分為禁止、指示、警告和其他4大類;將數(shù)據(jù)集制成VOC格式的數(shù)據(jù)集,并將所有標(biāo)注完成的數(shù)據(jù)劃分為兩部分:第一部分分為訓(xùn)練集、驗證集;第二部分作為測試集;
步驟2:搭建改進(jìn)YOLO v3算法網(wǎng)絡(luò)模型
對原始YOLO v3算法的特征提取網(wǎng)絡(luò)進(jìn)行改進(jìn),用密集殘差模塊代替原始特征提取網(wǎng)絡(luò)的最后一個殘差塊;特征提取網(wǎng)絡(luò)輸出不同尺寸的特征圖,對特征圖進(jìn)行上采樣和拼接操作后得到三個新的特征圖;對提取出的三個尺度的特征圖,分別利用一個卷積模塊對提取的特征做進(jìn)一步處理,調(diào)整輸出通道數(shù),得到預(yù)測框的置信度、位置信息和分類信息;
步驟3:檢測網(wǎng)絡(luò)訓(xùn)練之前,先使用Imagnet數(shù)據(jù)集首先對體征提取部分的網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,得到特征提取網(wǎng)絡(luò)的預(yù)訓(xùn)練模型,然后載入預(yù)訓(xùn)練模型權(quán)重,利用步驟1劃分得到的訓(xùn)練數(shù)據(jù)、驗證數(shù)據(jù)和測試數(shù)據(jù)繼續(xù)訓(xùn)練學(xué)習(xí)模型參數(shù);利用檢測網(wǎng)絡(luò)對目標(biāo)進(jìn)行預(yù)測得到預(yù)測框置信度、位置信息和分類信息,并計算預(yù)測值和真實之間的誤差,置信度誤差和分類誤差采用交叉熵誤差計算,訓(xùn)練過程中位置誤差采用CIoU誤差計算;
訓(xùn)練過程分為兩個階段:第一階段對預(yù)訓(xùn)練的特征提取網(wǎng)絡(luò)最后幾層參數(shù)進(jìn)行更新,第二階段對整個網(wǎng)絡(luò)參數(shù)進(jìn)行更新;訓(xùn)練時利用學(xué)習(xí)率衰減和早停策略對訓(xùn)練過程進(jìn)行監(jiān)控,當(dāng)誤差變化率小于預(yù)先設(shè)定閾值時,將學(xué)習(xí)率減半;當(dāng)模型在驗證集上一個周期內(nèi)的誤差比上一次的訓(xùn)練結(jié)果差的時候停止訓(xùn)練;
在步驟3中訓(xùn)練網(wǎng)絡(luò)時,損失函數(shù)分為三部分:置信度誤差Lconf,定位誤差Lloc和分類誤差Lcls;置信度誤差和分類誤差采用交叉熵誤差計算,位置誤差采用CIoU誤差計算;CIoU誤差計算步驟如下:
1)求預(yù)測框與真實框的IoU:
其中,I是預(yù)測框與真實框的交集,U是預(yù)測框與真實框的并集,IoU是預(yù)測框與真實框的交集和并集之比;
2)根據(jù)IoU定義目標(biāo)定位損失為:
其中,b,bgt分別表示真實框B和預(yù)測框Bgt的中心點,ρ(·)表示歐氏距離,c表示B,Bgt最小外接矩形的對角線距離;αv是一個一個影響因子,該影響因子將預(yù)測框的寬高比和真實框的寬高比考慮到損失函數(shù)的計算中;
步驟4:加載模型,對交通標(biāo)志進(jìn)行檢測。
2.根據(jù)權(quán)利要求1所述的一種基于改進(jìn)YOLO v3算法的遠(yuǎn)距離交通標(biāo)志檢測方法,其特征在于,所述步驟1中:處理完的圖像數(shù)據(jù)以jpg格式存在在JPEGImages文件夾下,圖像標(biāo)注數(shù)據(jù)以xml格式存放在Annotations文件夾下;xml文件中主要包含圖像的寬高、交通標(biāo)志的類別和真實框坐標(biāo)信息。
3.根據(jù)權(quán)利要求1所述的一種基于改進(jìn)YOLO v3算法的遠(yuǎn)距離交通標(biāo)志檢測方法,其特征在于,所述步驟1中:所有標(biāo)注完成的數(shù)據(jù)按照4:1的比例劃分為訓(xùn)練用數(shù)據(jù)和測試用數(shù)據(jù),訓(xùn)練用數(shù)據(jù)再按照9:1進(jìn)一步劃分為訓(xùn)練數(shù)據(jù)和驗證數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的一種基于改進(jìn)YOLO v3算法的遠(yuǎn)距離交通標(biāo)志檢測方法,其特征在于,所述步驟2中:特征提取網(wǎng)絡(luò)輸出8倍、16倍和32倍下采樣的特征圖,將其中32倍下采樣特征圖作為feat1,feat1經(jīng)過一次2倍上采樣后與16倍下采樣特征圖拼接得到feat2,feat2經(jīng)過一次兩倍上采樣后與8倍下采樣特征圖拼接得到feat3;特征提取網(wǎng)絡(luò)輸出的三個特征圖經(jīng)過一組卷積操作后得到預(yù)測框的置信度、位置和分類信息。
5.根據(jù)權(quán)利要求1所述的一種基于改進(jìn)YOLO v3算法的遠(yuǎn)距離交通標(biāo)志檢測方法,其特征在于,所述的步驟3中:對即將訓(xùn)練的數(shù)據(jù),采用數(shù)據(jù)增強(qiáng)方法先對數(shù)據(jù)進(jìn)行擴(kuò)增,主要包括:隨機(jī)扭曲、翻轉(zhuǎn)、截取和加入噪音。
6.根據(jù)權(quán)利要求1所述的一種基于改進(jìn)YOLO v3算法的遠(yuǎn)距離交通標(biāo)志檢測方法,其特征在于,所述的步驟3中:訓(xùn)練過程的兩個階段具體為:
1)第一階段訓(xùn)練過程中,取學(xué)習(xí)率0.001,預(yù)訓(xùn)練模型的模型結(jié)構(gòu)保持不變,將模型前k個網(wǎng)絡(luò)層權(quán)重鎖定,保持不變,利用交通標(biāo)志檢測數(shù)據(jù)集,重新訓(xùn)練未鎖定的層,網(wǎng)絡(luò)在訓(xùn)練集上訓(xùn)練多輪,得到新的權(quán)重;
2)第二階段訓(xùn)練過程采用學(xué)習(xí)率衰減和早停策略,對模型進(jìn)行微調(diào),設(shè)定較小的學(xué)習(xí)率,解凍所有網(wǎng)絡(luò)層,保持1)中得到的模型結(jié)構(gòu)和參數(shù)權(quán)重,利用訓(xùn)練集繼續(xù)訓(xùn)練多輪,不斷調(diào)整參數(shù)使網(wǎng)絡(luò)的損失越來越小,計算每個時間周期內(nèi)模型在驗證集上的誤差,當(dāng)模型在某個周期內(nèi)在驗證集上的誤差大于上一個周期內(nèi)驗證集上的誤差時,停止網(wǎng)絡(luò)更新,保存網(wǎng)絡(luò)模型;當(dāng)網(wǎng)絡(luò)在連續(xù)k個周期迭代后在驗證集上的損失下降小于預(yù)先設(shè)定閾值時,則將學(xué)習(xí)率進(jìn)行減半。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011159601.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于FPGA的Tiny-yolo卷積神經(jīng)網(wǎng)絡(luò)硬件加速方法及系統(tǒng)
- 一種基于YOLO的Compress-YOLO模型壓縮方法
- 一種面向計算資源局限平臺部署的實時目標(biāo)檢測的方法
- 一種用于星上對艦船目標(biāo)檢測的Tiny-YOLO網(wǎng)絡(luò)的優(yōu)化方法
- 一種基于改進(jìn)YOLO v3模型的行人檢測方法
- 一種基于改進(jìn)YOLO v4算法的目標(biāo)檢測方法
- 一種YOLO脈沖神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法
- 圖像識別方法、裝置、計算機(jī)可讀存儲介質(zhì)及處理器
- 一種船只檢測方法和裝置
- YOLO神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、行人檢測方法和相關(guān)設(shè)備





