[發(fā)明專利]一種基于深度殘差網(wǎng)絡(luò)的車型識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810170873.5 | 申請(qǐng)日: | 2018-03-01 |
| 公開(公告)號(hào): | CN108629267B | 公開(公告)日: | 2021-05-25 |
| 發(fā)明(設(shè)計(jì))人: | 劉敦強(qiáng);沈峘 | 申請(qǐng)(專利權(quán))人: | 南京航空航天大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/04 |
| 代理公司: | 江蘇圣典律師事務(wù)所 32237 | 代理人: | 賀翔 |
| 地址: | 210016 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 網(wǎng)絡(luò) 車型 識(shí)別 方法 | ||
1.一種基于深度殘差網(wǎng)絡(luò)的車型識(shí)別方法,其特征在于,包括:
S1、對(duì)深度殘差網(wǎng)絡(luò)進(jìn)行參數(shù)初始化;
S2、將訓(xùn)練數(shù)據(jù)載入所述深度殘差網(wǎng)絡(luò),結(jié)合數(shù)據(jù)增強(qiáng)策略,訓(xùn)練得到訓(xùn)練好的深度殘差網(wǎng)絡(luò);
S3、將車型圖像載入所述訓(xùn)練好的深度殘差網(wǎng)絡(luò),所述訓(xùn)練好的深度殘差網(wǎng)絡(luò)進(jìn)行識(shí)別,并從網(wǎng)絡(luò)輸出端輸出類別標(biāo)簽;
其中,所述深度殘差網(wǎng)絡(luò)包括五個(gè)殘差單元、兩個(gè)全連接層、多分類對(duì)率回歸損失層、中心損失層,
第一殘差單元的組成按照總體模型在輸入樣本進(jìn)行預(yù)測(cè)時(shí)的數(shù)據(jù)流向依次為卷積層1,參數(shù)包括通道數(shù)為128,卷積核尺寸為3和3,步長(zhǎng)為2,補(bǔ)零項(xiàng)尺寸為1和1;批量正則化層1,參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;線性激活層1;卷積層2,參數(shù)包括通道數(shù)為256,卷積核尺寸為1和1,步長(zhǎng)為1,補(bǔ)零項(xiàng)尺寸為0和0;批量正則化層2, 參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;數(shù)值單元融合層,模式為相加操作;線性激活層2,
第二殘差單元的組成按照總體模型在輸入樣本進(jìn)行預(yù)測(cè)時(shí)的數(shù)據(jù)流向依次為卷積層1,參數(shù)包括通道數(shù)為256,卷積核尺寸為3和3,步長(zhǎng)為2,補(bǔ)零項(xiàng)尺寸為1和1;批量正則化層1,參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;線性激活層1;卷積層2,參數(shù)包括通道數(shù)為512,卷積核尺寸為1和1,步長(zhǎng)為1,補(bǔ)零項(xiàng)尺寸為0和0;批量正則化層2, 參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;數(shù)值單元融合層,模式為相加操作;線性激活層2,
第三殘差單元的組成按照總體模型在輸入樣本進(jìn)行預(yù)測(cè)時(shí)的數(shù)據(jù)流向依次為卷積層1,參數(shù)包括通道數(shù)為512,卷積核尺寸為3和3,步長(zhǎng)為2,補(bǔ)零項(xiàng)尺寸為1和1;批量正則化層1,參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;線性激活層1;卷積層2,參數(shù)包括通道數(shù)為1024,卷積核尺寸為1和1,步長(zhǎng)為1,補(bǔ)零項(xiàng)尺寸為0和0;批量正則化層2, 參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;數(shù)值單元融合層,模式為相加操作;線性激活層2,
第四殘差單元的組成按照總體模型在輸入樣本進(jìn)行預(yù)測(cè)時(shí)的數(shù)據(jù)流向依次為卷積層1,參數(shù)包括通道數(shù)為1024,卷積核尺寸為3和3,步長(zhǎng)為2,補(bǔ)零項(xiàng)尺寸為1和1;批量正則化層1,參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;線性激活層1;卷積層2,參數(shù)包括通道數(shù)為2048,卷積核尺寸為1和1,步長(zhǎng)為1,補(bǔ)零項(xiàng)尺寸為0和0;批量正則化層2, 參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;數(shù)值單元融合層,模式為相加操作;線性激活層2,
第五殘差單元的組成按照總體模型在輸入樣本進(jìn)行預(yù)測(cè)時(shí)的數(shù)據(jù)流向依次為卷積層1,參數(shù)包括通道數(shù)為2048,卷積核尺寸為3和3,步長(zhǎng)為2,補(bǔ)零項(xiàng)尺寸為1和1;批量正則化層1,參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;線性激活層1;卷積層2,參數(shù)包括通道數(shù)為1024,卷積核尺寸為1和1,步長(zhǎng)為1,補(bǔ)零項(xiàng)尺寸為0和0;批量正則化層2, 參數(shù)包括動(dòng)態(tài)更新值2,以及仿射比例和仿射偏置;數(shù)值單元融合層,模式為相加操作;線性激活層2,
第一全連接層的內(nèi)部參數(shù)包括二維矩陣權(quán)重,尺寸分別是50176和4096,以及一維矩陣偏置,尺寸為4096,
第二全連接層的內(nèi)部參數(shù)包括二維矩陣權(quán)重,尺寸分別是4096和1000,以及一維矩陣偏置,尺寸為1000,
多分類對(duì)率回歸損失層無(wú)內(nèi)部參數(shù),輸出為各個(gè)輸入特征以自然數(shù)空間為基準(zhǔn)相對(duì)于同樣以自然數(shù)空間為基準(zhǔn)的輸入特征總和的比例,
中心損失層的內(nèi)部參數(shù)只有二維矩陣中心距離,尺寸為196和4096,該參數(shù)在第一次訓(xùn)練時(shí)設(shè)置為全零矩陣,隨后每經(jīng)過一個(gè)訓(xùn)練批次就按照當(dāng)前訓(xùn)練批次的特征所屬的類別計(jì)算該類別下的特征的歐氏距離均值,然后乘以學(xué)習(xí)率得到更新值,最后對(duì)該類別下的中心距離進(jìn)行更新。
2.根據(jù)權(quán)利要求1所述的方法,在所述S1中,所述參數(shù)初始化為基于高斯分布的方法初始化學(xué)習(xí)參數(shù),其中高斯中心為0,高斯方差為訓(xùn)練時(shí)一個(gè)訓(xùn)練批次樣本數(shù)的兩倍倒數(shù)的平方根。
3.根據(jù)權(quán)利要求1所述的方法,在所述S2中,所述訓(xùn)練使用的數(shù)據(jù)增強(qiáng)方法包括圖像水平翻轉(zhuǎn)、圖像隨機(jī)尺寸剪切、圖像隨機(jī)噪聲添加;所述訓(xùn)練采用隨機(jī)梯度下降訓(xùn)練方法,一個(gè)訓(xùn)練批次的訓(xùn)練樣本數(shù)為128個(gè),總的迭代次數(shù)為80個(gè)訓(xùn)練周期,1個(gè)訓(xùn)練周期代表總的訓(xùn)練樣本對(duì)1個(gè)訓(xùn)練周期的商,每經(jīng)過1個(gè)訓(xùn)練周期就隨機(jī)生成總的所述訓(xùn)練樣本的訓(xùn)練次序,學(xué)習(xí)率參數(shù)采用階梯下降策略,所述學(xué)習(xí)率的初始值設(shè)為0.01,經(jīng)過30個(gè)訓(xùn)練周期和50個(gè)訓(xùn)練周期時(shí)分別下降一次,下降因子為0.1,權(quán)重衰減項(xiàng)為0.0005,動(dòng)量項(xiàng)為0.9。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京航空航天大學(xué),未經(jīng)南京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810170873.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





