[發(fā)明專利]一種基于區(qū)域注意力的交通標(biāo)志檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110425906.8 | 申請(qǐng)日: | 2021-04-20 |
| 公開(公告)號(hào): | CN113033482A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 李文舉;蘇攀;那馨元 | 申請(qǐng)(專利權(quán))人: | 上海應(yīng)用技術(shù)大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 黃超宇;胡晶 |
| 地址: | 200235 上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 區(qū)域 注意力 交通標(biāo)志 檢測(cè) 方法 | ||
本發(fā)明公開了一種基于區(qū)域注意力的交通標(biāo)志檢測(cè)方法,包括步驟1:獲取ImageNet數(shù)據(jù)集和TT100K交通標(biāo)志數(shù)據(jù)集,在ImageNet數(shù)據(jù)集上預(yù)先訓(xùn)練ResNet50深度網(wǎng)絡(luò);步驟2:輸入TT100K訓(xùn)練集圖片,從預(yù)訓(xùn)練的ResNet50網(wǎng)絡(luò)的第10、22、40和49層獲取樣本特征,構(gòu)成特征金字塔,在Faster R?CNN目標(biāo)檢測(cè)框架下對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào);步驟3:訓(xùn)練數(shù)據(jù)集以圖片形式輸入?yún)^(qū)域注意力模塊,獲取注意力圖;步驟4:RPN網(wǎng)絡(luò)使用特征金字塔的信息生成候選區(qū)域;步驟5:利用區(qū)域注意力圖濾除注意力區(qū)域之外的候選區(qū)域,得到最終的檢測(cè)結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及交通標(biāo)志檢測(cè)領(lǐng)域,特別涉及一種基于區(qū)域注意力的交通標(biāo)志檢測(cè)方法。
背景技術(shù)
交通標(biāo)志檢測(cè)技術(shù)是交通標(biāo)志識(shí)別系統(tǒng)的關(guān)鍵技術(shù)之一,廣泛應(yīng)用于自動(dòng)駕駛汽車、輔助駕駛系統(tǒng)和交通秩序管制等領(lǐng)域。交通標(biāo)志的檢測(cè)和識(shí)別是目標(biāo)檢測(cè)的一個(gè)應(yīng)用場(chǎng)景,但是交通標(biāo)志的檢測(cè)有其特殊性。在真實(shí)場(chǎng)景下,交通標(biāo)志的檢測(cè)過程可能會(huì)受到光照、變形、遮擋等問題,而且交通標(biāo)志的檢測(cè)在某些場(chǎng)景下屬于小目標(biāo)檢測(cè),目標(biāo)在圖片中所占面積可能不足1/1000。
目前,主流的交通標(biāo)志檢測(cè)方法大多采用的是基于顏色分割或者結(jié)合形狀特性的方法,該方法依靠人工設(shè)計(jì)的特征檢測(cè)交通標(biāo)志。在實(shí)際運(yùn)行環(huán)境中,這種人工設(shè)計(jì)的特征極易受到光照、天氣和視點(diǎn)等變化的干擾,使得小目標(biāo)交通標(biāo)志的檢測(cè)變得困難。
近年來,隨著深度學(xué)習(xí)方法在目標(biāo)識(shí)別、圖像檢索等領(lǐng)域取得的巨大成功,研究者開始嘗試使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)解決交通標(biāo)志識(shí)別問題。有研究表明從預(yù)訓(xùn)練的CNN模型中提取的圖像特征較人工設(shè)計(jì)的特征有更好的表現(xiàn)。以圖像分類為目標(biāo)訓(xùn)練的卷積核更傾向于抓取那些有可能成為圖像分類目標(biāo)的對(duì)象,這對(duì)于檢測(cè)和識(shí)別是有利的。然而,從CNN中提取的高維度特征向量增加了計(jì)算復(fù)雜度,這對(duì)于需要實(shí)時(shí)運(yùn)行的交通標(biāo)志檢測(cè)和識(shí)別是一個(gè)挑戰(zhàn)。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中的不足,本發(fā)明提供一種基于區(qū)域注意力的交通標(biāo)志檢測(cè)方法,以實(shí)現(xiàn)準(zhǔn)確檢測(cè)出路邊的交通標(biāo)志,從而減小由于預(yù)測(cè)的候選區(qū)域過多導(dǎo)致的識(shí)別效率低的問題。針對(duì)特定的交通標(biāo)志檢測(cè)任務(wù),引入?yún)^(qū)域注意力的方法優(yōu)化網(wǎng)絡(luò)模型,提高交通標(biāo)志檢測(cè)的準(zhǔn)確率,減小候選區(qū)域的數(shù)量。通過使用特征金字塔提升對(duì)小目標(biāo)的檢測(cè)精度,提高特征對(duì)視角和光照變化的魯棒性,降低對(duì)小目標(biāo)的漏檢率。
為了達(dá)到上述發(fā)明目的,解決其技術(shù)問題所采用的技術(shù)方案如下:
一種基于區(qū)域注意力的交通標(biāo)志檢測(cè)方法,包括以下步驟:
步驟1:獲取ImageNet數(shù)據(jù)集和TT100K交通標(biāo)志數(shù)據(jù)集,在ImageNet數(shù)據(jù)集上預(yù)先訓(xùn)練ResNet50深度網(wǎng)絡(luò);
步驟2:輸入TT100K訓(xùn)練集圖片,從預(yù)訓(xùn)練的ResNet50網(wǎng)絡(luò)的第10、22、40和49層獲取樣本特征,構(gòu)成特征金字塔,在Faster R-CNN目標(biāo)檢測(cè)框架下對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào);
步驟3:訓(xùn)練數(shù)據(jù)集以圖片形式輸入?yún)^(qū)域注意力模塊,獲取注意力圖;
步驟4:RPN網(wǎng)絡(luò)使用特征金字塔的信息生成候選區(qū)域;
步驟5:利用區(qū)域注意力圖濾除注意力區(qū)域之外的候選區(qū)域,得到最終的檢測(cè)結(jié)果。
進(jìn)一步的,在所述步驟1中,使用了遷移學(xué)習(xí)的方法,在ImageNet數(shù)據(jù)集上對(duì)ResNet50進(jìn)行預(yù)訓(xùn)練,所述ImageNet是一個(gè)大型的圖像分類數(shù)據(jù)集,包含100個(gè)目標(biāo)類別,所述ResNet50是一個(gè)包含殘差模塊的卷積神經(jīng)網(wǎng)絡(luò),一共有50個(gè)權(quán)重層。
進(jìn)一步的,在所述步驟2中,獲取在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的ResNet50分類模型,將全連接層之外的卷積層作為特征提取模塊,并從網(wǎng)絡(luò)的第10、22、40和49層卷積層提取特征圖,構(gòu)成特征金字塔;將全連接層作為網(wǎng)絡(luò)最終的分類模塊,并另外添加一個(gè)3層的全連接層作為交通標(biāo)志位置回歸模塊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海應(yīng)用技術(shù)大學(xué),未經(jīng)上海應(yīng)用技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110425906.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種鏤空植毛面牙刷及其制作方法
- 下一篇:一種治療癬藥膏的制備方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 云端導(dǎo)航裝置及云端導(dǎo)航方法
- 一種基于SURF的交通標(biāo)志識(shí)別方法及系統(tǒng)
- 簡(jiǎn)易可變交通標(biāo)志牌
- 簡(jiǎn)易可變交通標(biāo)志牌
- 用于探測(cè)機(jī)動(dòng)車經(jīng)過交通標(biāo)志門通行的方法和裝置
- 一種對(duì)象匹配方法及裝置
- 一種基于深度學(xué)習(xí)的高精度交通標(biāo)志檢測(cè)方法及系統(tǒng)
- 一種交通標(biāo)志圖像識(shí)別模型構(gòu)建及識(shí)別方法
- 基于雙拍攝設(shè)備的交通標(biāo)志識(shí)別方法及裝置
- 交通標(biāo)志異常檢測(cè)方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)





