[發(fā)明專利]基于全局區(qū)域先驗(yàn)注意力的目標(biāo)檢測方法有效
| 申請?zhí)枺?/td> | 202011365545.4 | 申請日: | 2020-11-28 |
| 公開(公告)號: | CN112381106B | 公開(公告)日: | 2022-09-09 |
| 發(fā)明(設(shè)計)人: | 吳澤彬;龔航;徐偉;趙朝蓬;劉建新;陳圣堂;徐洋;陳剛;夏雷;顧濤;丁道華;晁京 | 申請(專利權(quán))人: | 南京理工大學(xué);中國鐵路上海局集團(tuán)有限公司南京供電段 |
| 主分類號: | G06V10/44 | 分類號: | G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06T3/40 |
| 代理公司: | 南京理工大學(xué)專利中心 32203 | 代理人: | 陳鵬 |
| 地址: | 210094 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 全局 區(qū)域 先驗(yàn) 注意力 目標(biāo) 檢測 方法 | ||
本發(fā)明公開了一種基于全局區(qū)域先驗(yàn)注意力機(jī)制的目標(biāo)檢測方法,包括如下步驟:遍歷所有訓(xùn)練樣本,統(tǒng)計目標(biāo)出現(xiàn)在圖像中的頻率,得到全局先驗(yàn)注意力;獲取待檢測圖像,利用訓(xùn)練得到的特征提取網(wǎng)絡(luò)對圖像進(jìn)行特征提取,同時利用卷積神經(jīng)網(wǎng)絡(luò)提取自適應(yīng)注意力,對全局先驗(yàn)注意力進(jìn)行修正與增強(qiáng)得到自適應(yīng)全局先驗(yàn)注意力,使用自適應(yīng)全局先驗(yàn)注意力增強(qiáng)特征圖;最后再進(jìn)行目標(biāo)檢測。本方法提出了全局區(qū)域先驗(yàn)注意力機(jī)制網(wǎng)絡(luò),提升了訓(xùn)練收斂速度,在保證檢測速度的同時提高了目標(biāo)檢測精度,在目標(biāo)種類少出現(xiàn)在特定位置的目標(biāo)檢測應(yīng)用場景中提升更加明顯。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種基于全局區(qū)域先驗(yàn)注意力的目標(biāo)檢測方法
背景技術(shù)
近年來,計算機(jī)視覺在各個領(lǐng)域得到了廣泛的應(yīng)用,解放了社會生產(chǎn)力。目標(biāo)檢測是計算機(jī)視覺中一項(xiàng)十分重要的任務(wù)。隨著深度深學(xué)習(xí)的發(fā)展,目標(biāo)檢測得到了廣泛的研究,促進(jìn)了計算機(jī)視覺在各個領(lǐng)域的應(yīng)用。目標(biāo)檢測能夠標(biāo)記處圖像或者視頻中我們想要檢測的目標(biāo)位置與類別。這一功能能夠擴(kuò)展為許多實(shí)際應(yīng)用,例如:自動駕駛、行人追蹤、文本識別等。
基于傳統(tǒng)方法的目標(biāo)檢測技術(shù)存在速度慢、精度低等劣勢。隨著深度學(xué)習(xí)技術(shù)與計算機(jī)硬件技術(shù)的發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)得到了長足的發(fā)展,使得精度與速度都有了質(zhì)的提升,達(dá)到了實(shí)際使用的速度與精度。但是目前的目標(biāo)檢測方法在較困難場景中的目標(biāo)檢測仍然有較大的提升空間。
人類眼球中只有視網(wǎng)膜中央凹存在高密度的視錐細(xì)胞,人類為了更好的感知環(huán)境,會將感興趣區(qū)域集中到視網(wǎng)膜中央凹。計算機(jī)視覺注意力由此誕生。近年來,有學(xué)者使用注意力模型對目標(biāo)檢測中的特征提取網(wǎng)絡(luò)進(jìn)行增強(qiáng)。普通的目標(biāo)檢測與有如下難點(diǎn):1)特征提取時對背景與目標(biāo)同等對待,難以突出待檢測目標(biāo)的特征;2)普通注意力模型難以保證注意力的正確性;3)對于小目標(biāo)難以檢測。因此普通的注意力模型與目標(biāo)檢測的結(jié)合有其局限性。
通過上述描述,如何準(zhǔn)確地得到注意力掩膜來更好地進(jìn)行特征提取是亟待解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于全局區(qū)域先驗(yàn)注意力的目標(biāo)檢測方法,提高注意力掩膜的準(zhǔn)確度,最終提高目標(biāo)檢測的精度。
實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為:一種基于全局區(qū)域先驗(yàn)注意力的目標(biāo)檢測方法,包括如下步驟:
步驟(A),遍歷訓(xùn)練集,統(tǒng)計每個訓(xùn)練樣本中目標(biāo)出現(xiàn)的位置信息,得到全局區(qū)域先驗(yàn)注意力;
步驟(B),獲取待檢測圖像,利用訓(xùn)練得到的特征提取網(wǎng)絡(luò)對原圖進(jìn)行特征提取;
步驟(C),從主干網(wǎng)絡(luò)中分支出自適應(yīng)注意力網(wǎng)絡(luò)分支,利用自適應(yīng)注意力網(wǎng)絡(luò)對全局區(qū)域先驗(yàn)注意力進(jìn)行修正與增強(qiáng),得到自適應(yīng)全局區(qū)域先驗(yàn)注意力掩膜;將注意力掩膜點(diǎn)乘到特征圖上,然后對特征圖進(jìn)行目標(biāo)檢測。
進(jìn)一步的,步驟(A),遍歷訓(xùn)練集,統(tǒng)計每個訓(xùn)練樣本中目標(biāo)出現(xiàn)的位置信息,得到全局區(qū)域先驗(yàn)注意力,包括如下步驟:
(A1),在訓(xùn)練樣本圖片中人工框選出目標(biāo)所在的區(qū)域,獲取訓(xùn)練樣本圖片中目標(biāo)所在的目標(biāo)區(qū)域的位置信息作為標(biāo)簽保存;
(A2),將訓(xùn)練樣本圖片與全局區(qū)域先驗(yàn)注意力縮放至所設(shè)定的尺寸;
(A3),初始化全局區(qū)域先驗(yàn)注意力每個值為零,遍歷訓(xùn)練樣本,將全局區(qū)域先驗(yàn)注意力中所有與訓(xùn)練樣本圖片的標(biāo)簽中所劃定的區(qū)域同一位置的像素的像素值加1,得到全局區(qū)域先驗(yàn)注意力;
(A4),使用sigmoid函數(shù)對全局區(qū)域先驗(yàn)注意力進(jìn)行歸一化,得到全局區(qū)域先驗(yàn)注意力。
進(jìn)一步的,所述步驟(C)包括如下步驟:
(C1),從主干特征提取網(wǎng)絡(luò)中的特征中提取特征作為全局區(qū)域先驗(yàn)注意力修正增強(qiáng)網(wǎng)絡(luò)的輸入;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京理工大學(xué);中國鐵路上海局集團(tuán)有限公司南京供電段,未經(jīng)南京理工大學(xué);中國鐵路上海局集團(tuán)有限公司南京供電段許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011365545.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于靈活柵格光網(wǎng)絡(luò)全局優(yōu)化的系統(tǒng)架構(gòu)及其全局優(yōu)化方法
- 一種基于多數(shù)據(jù)庫類型的SQL執(zhí)行方法和裝置
- 用于移動AdHoc網(wǎng)絡(luò)的路由入侵檢測系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 全局資源分配方法和裝置
- 一種通信方法及裝置
- 一種高效分布式全局鎖協(xié)調(diào)方法
- 一種帶上下文信息編碼的語義分割卷積神經(jīng)網(wǎng)絡(luò)
- 一種批量腳本的全局參數(shù)替換方法及裝置
- 一種基于全局變量的家居參數(shù)化模型建模系統(tǒng)及方法





