[發(fā)明專(zhuān)利]一種基于改進(jìn)Faster R-CNN的道路環(huán)境視覺(jué)感知方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811323004.8 | 申請(qǐng)日: | 2018-11-08 |
| 公開(kāi)(公告)號(hào): | CN109447018B | 公開(kāi)(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計(jì))人: | 董恩增;路堯;佟吉?jiǎng)?/a> | 申請(qǐng)(專(zhuān)利權(quán))人: | 天津理工大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 天津耀達(dá)律師事務(wù)所 12223 | 代理人: | 侯力 |
| 地址: | 300384 *** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) faster cnn 道路 環(huán)境 視覺(jué) 感知 方法 | ||
1.一種基于改進(jìn)Faster R-CNN的道路環(huán)境視覺(jué)感知方法,其特征在于:它包括,
S1、讀取圖片信息后,一張X*Y大小的圖片會(huì)縮放至H*W,經(jīng)Feature extractionnetwork模塊的ResNet-101特征提取網(wǎng)絡(luò)提取圖片的Feature maps;
S2、步驟S1中輸出的Feature maps進(jìn)入Region proposal network模塊,Regionproposal network模塊運(yùn)用3*3大小的滑動(dòng)窗遍歷Feature maps,每個(gè)像素預(yù)測(cè)出54個(gè)anchor boxes,通過(guò)Softmax層判斷anchors屬于前景或者背景,再利用邊框回歸修正anchors獲得精確的Proposals;
S3、ClassificationBoundingbox regression模塊收集步驟S1中得到的Featuremaps和步驟S2中得到的Proposals,通過(guò)Read-only ROI挖掘困難樣本,使用ROI-2更新模型參數(shù),最后得到目標(biāo)物體分類(lèi)結(jié)果和邊框回歸的偏移量;
S4、建立訓(xùn)練數(shù)據(jù)集:為完善算法在雨雪、霧霾天氣中的目標(biāo)檢測(cè)效果,結(jié)合自動(dòng)駕駛數(shù)據(jù)集KITTI和Oxford RobotCar組成混合自動(dòng)駕駛訓(xùn)練集;為減少假陽(yáng)性率,數(shù)據(jù)集標(biāo)簽整合為‘car’類(lèi)和‘pedestrian’類(lèi),并將數(shù)據(jù)集制作成PASCALVOC2007數(shù)據(jù)集的格式;
S5、訓(xùn)練網(wǎng)絡(luò)模型:使用GPU_0、GPU_1聯(lián)合并行訓(xùn)練;使用遷移學(xué)習(xí)的方式,F(xiàn)eatureextraction network模塊中的ResNet-101在ImageNet訓(xùn)練后得到的網(wǎng)絡(luò)模型做為預(yù)訓(xùn)練模型,混合自動(dòng)駕駛數(shù)據(jù)集做fine-tuning;訓(xùn)練方式為四步交替優(yōu)化法。
2.如權(quán)利要求1所述的一種基于改進(jìn)Faster R-CNN的道路環(huán)境視覺(jué)感知方法,其特征在于:所述步驟S1中X*Y大小的圖片在進(jìn)入網(wǎng)絡(luò)模型前縮放至H*W,F(xiàn)eature extractionnetwork模塊中的特征提取網(wǎng)絡(luò)為100層的全卷積網(wǎng)絡(luò)ResNet-101,包括Conv1、Conv2_x、Conv3_x、Conv4_x、Conv5_x;經(jīng)Resnet-101特征提取網(wǎng)絡(luò)的Conv1、Conv2_x、Conv3_x、Conv4_x后,Conv4_x輸出的Feature maps分別送入Region proposal network模塊和ClassificationBoundingbox regression模塊提取Regionproposals、挖掘困難樣本;其中在ClassificationBoundingbox regression模塊的ROI Pooling層后再加入Conv5_x的九層網(wǎng)絡(luò)增強(qiáng)圖像特征,提升后續(xù)物體分類(lèi)效果。
3.如權(quán)利要求2所述的一種基于改進(jìn)Faster R-CNN的道路環(huán)境視覺(jué)感知方法,其特征在于:所述步驟S2中,Region proposal network模塊使用3*3大小的滑動(dòng)窗遍歷Conv4_x輸出的Feature maps的每個(gè)像素點(diǎn),位于滑動(dòng)窗中心的錨點(diǎn)預(yù)測(cè)6種尺度、9種比例的54個(gè)anchor boxes;anchor boxes經(jīng)Softmax層提取包含目標(biāo)物體的Proposals,并使用邊框回歸法修正Proposals的坐標(biāo);最后使用Soft-NMS方法去掉重疊度高的包圍框得到精確的Proposals。
4.如權(quán)利要求1所述的一種基于改進(jìn)Faster R-CNN的道路環(huán)境視覺(jué)感知方法,其特征在于:所述步驟S3中,將Proposals送入ClassificationBoundingbox regression模塊,該模塊包括只讀的Read-only ROI網(wǎng)絡(luò)和具有前-后向傳播功能的ROI-2網(wǎng)絡(luò),兩個(gè)網(wǎng)絡(luò)間共享權(quán)重;Proposals在Read-only ROI網(wǎng)絡(luò)中計(jì)算分類(lèi)損失和邊框回歸損失;然后將損失按降序排列,選擇具有高損失性的Hard region proposal;最后將Hard region proposal輸入ROI-2網(wǎng)絡(luò)中計(jì)算困難樣本的損失回傳給卷積神經(jīng)網(wǎng)絡(luò)來(lái)更新整個(gè)網(wǎng)絡(luò)參數(shù),最終得到目標(biāo)物體類(lèi)別和位置的精準(zhǔn)結(jié)果。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于天津理工大學(xué),未經(jīng)天津理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811323004.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 輸電線路中的鳥(niǎo)巢自動(dòng)識(shí)別系統(tǒng)及其方法和應(yīng)用
- 一種基于圖片蒸餾的通用物體檢測(cè)系統(tǒng)及其實(shí)現(xiàn)方法
- 一種基于Faster-RCNN的機(jī)場(chǎng)跑道異物檢測(cè)方法
- 一種基于Faster R-CNN的坦克裝甲目標(biāo)檢測(cè)方法
- 一種基于改進(jìn)Faster-RCNN的電力設(shè)備外觀缺陷檢測(cè)方法
- 基于Faster RCNN的飛行目標(biāo)協(xié)同識(shí)別方法
- 一種電力設(shè)備辨識(shí)方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種基于FPGA的faster-RCNN目標(biāo)檢測(cè)方法
- 一種基于Faster-RCNN的軸承滾子瑕疵檢測(cè)方法
- 一種改進(jìn)Faster-RCNN模型的模糊目標(biāo)檢測(cè)方法
- 圖像語(yǔ)義標(biāo)注的設(shè)備和方法及其模型的生成方法和系統(tǒng)
- 使用卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像處理
- 為數(shù)據(jù)庫(kù)確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 采用嵌入式系統(tǒng)中的小規(guī)模卷積神經(jīng)網(wǎng)絡(luò)模塊的人臉檢測(cè)
- 針對(duì)深度通道和卷積神經(jīng)網(wǎng)絡(luò)圖像和格式使用相機(jī)設(shè)備的方法和系統(tǒng)
- 處理卷積神經(jīng)網(wǎng)絡(luò)的方法
- CNN加速器和電子設(shè)備
- 一種基于混合神經(jīng)網(wǎng)絡(luò)的腦電時(shí)空特征學(xué)習(xí)與情感分類(lèi)方法
- 一種基于FPGA的深度學(xué)習(xí)加速方法





