[發(fā)明專利]一種基于注意力機(jī)制的小目標(biāo)檢測(cè)算法有效
| 申請(qǐng)?zhí)枺?/td> | 202011083094.5 | 申請(qǐng)日: | 2020-10-12 |
| 公開(公告)號(hào): | CN112163580B | 公開(公告)日: | 2022-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 禹發(fā);張衛(wèi)山;張友彩;顧伶俐 | 申請(qǐng)(專利權(quán))人: | 中國(guó)石油大學(xué)(華東) |
| 主分類號(hào): | G06V10/25 | 分類號(hào): | G06V10/25;G06V10/40 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 機(jī)制 目標(biāo) 檢測(cè) 算法 | ||
本發(fā)明提出一種基于注意力機(jī)制的小目標(biāo)檢測(cè)算法,在檢測(cè)過程中加入了注意力機(jī)制,從而將注意力機(jī)制應(yīng)用到不同通道的特征圖上,增強(qiáng)對(duì)于識(shí)別有利的通道,抑制對(duì)于識(shí)別無用的通道。在檢測(cè)時(shí),先將圖像輸入RPN中,得到預(yù)選區(qū)域,而后經(jīng)過FPN網(wǎng)絡(luò)提取各個(gè)尺度的特征,將其輸入注意力模塊,得到新的特征圖,最后對(duì)這些特征進(jìn)行分類與邊框回歸,得到檢測(cè)結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)、目標(biāo)檢測(cè)、注意力機(jī)制,具體涉及到一種基于注意力機(jī)制的小目標(biāo)檢測(cè)算法。
背景技術(shù)
近年來,目標(biāo)檢測(cè)取得了長(zhǎng)足的發(fā)展。盡管有了這些改進(jìn),但在檢測(cè)小目標(biāo)和大目標(biāo)之間的性近年來,物體檢測(cè)取得了令人矚目的進(jìn)展。盡管有這些改進(jìn),但在檢測(cè)小物體和大物體之間的性能仍然存在顯著差距。小目標(biāo)問題在物體檢測(cè)和語義分割等視覺任務(wù)中一直是存在的一個(gè)難點(diǎn),小目標(biāo)的檢測(cè)精度通常只有大目標(biāo)的一半。最接近本發(fā)明的技術(shù)有:
(1)、YOLO:YOLO將物體檢測(cè)作為回歸問題求解。基于一個(gè)單獨(dú)的End-To-End網(wǎng)絡(luò),完成從原始圖像的輸入到物體位置和類別的輸出,輸入圖像經(jīng)過一次Inference,便能得到圖像中所有物體的位置和其所屬類別及相應(yīng)的置信概率。檢測(cè)速度非常快,但是準(zhǔn)確率較低,誤檢率高,并無法滿足實(shí)際需求。
(2)、SSD:SSD結(jié)合了YOLO中的回歸思想和Faster-RCNN中的Anchor機(jī)制,使用全圖各個(gè)位置的多尺度區(qū)域特征進(jìn)行回歸,既保持了YOLO速度快的特性,也保證了窗口預(yù)測(cè)的跟Faster-RCNN 一樣比較精準(zhǔn)。但是SSD需要人工設(shè)置網(wǎng)絡(luò)層參數(shù),優(yōu)化比較依賴于經(jīng)驗(yàn),同時(shí)在小目標(biāo)檢測(cè)上并沒有比較好的表現(xiàn)。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中的缺點(diǎn)和不足,本發(fā)明提出了基于注意力機(jī)制的小目標(biāo)檢測(cè)算法。
本發(fā)明的技術(shù)方案為:
一種基于注意力機(jī)制的小目標(biāo)檢測(cè)算法,在檢測(cè)過程中加入了注意力機(jī)制,從而將注意力機(jī)制應(yīng)用到不同通道的特征圖上,增強(qiáng)對(duì)于識(shí)別有利的通道,抑制對(duì)于識(shí)別無用的通道。包括以下步驟:
步驟(1)、將圖像輸入RPN網(wǎng)絡(luò),提取預(yù)選區(qū)域;
步驟(2)、將步驟(1)中獲取的區(qū)域輸入FPN,提取多尺度的特征;
步驟(3)、將多尺度的特征輸入注意力機(jī)制模塊;
步驟(4)、在注意力機(jī)制模塊中,通過兩個(gè)全連接層和一個(gè) Sigmod函數(shù)來計(jì)算特征通道的權(quán)值;
步驟(5)、將步驟(4)中獲得的特征圖輸入ROI Align層;
步驟(6)、根據(jù)步驟(5)中得到的特征圖,進(jìn)行分類和回歸,得到檢測(cè)結(jié)果;
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明基于注意力機(jī)制的小目標(biāo)檢測(cè)算法的流程圖。
圖2為網(wǎng)絡(luò)中的注意力機(jī)制模塊示意圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)石油大學(xué)(華東),未經(jīng)中國(guó)石油大學(xué)(華東)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011083094.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)
- 目標(biāo)檢測(cè)裝置、學(xué)習(xí)裝置、目標(biāo)檢測(cè)系統(tǒng)及目標(biāo)檢測(cè)方法
- 目標(biāo)監(jiān)測(cè)方法、目標(biāo)監(jiān)測(cè)裝置以及目標(biāo)監(jiān)測(cè)程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測(cè)方法和目標(biāo)檢測(cè)裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





