[發明專利]一種基于新型特征金字塔網絡的圖像目標檢測方法在審
| 申請號: | 202210048960.X | 申請日: | 2022-01-17 |
| 公開(公告)號: | CN114511006A | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 潘晴;黃強;田妮莉 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06V10/80;G06V10/82;G06V10/46 |
| 代理公司: | 廣東廣信君達律師事務所 44329 | 代理人: | 戴緒霖 |
| 地址: | 510062 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 新型 特征 金字塔 網絡 圖像 目標 檢測 方法 | ||
本發明公開了一種基于新型特征金字塔網絡的圖像目標檢測方法,首先采用金字塔池化模塊對輸入的最高等級特征圖處理,得到包含特征圖不同大小區域上下文信息的多尺度特征,然后對所有等級的特征圖進行降維和平均池化,得到通道數一致、大小一致的四個特征圖,再送入兩個1x1卷積層計算得到位置權重,并對四個特征圖進行位置加權,然后采用3x3卷積對最高等級的特征圖進行處理并自上而下相加融合得到五個特征圖,最后在五個特征圖上預測,得到目標檢測結果。本發明不僅能解決混疊效應、高級語義信息被稀釋和低級空間信息局限訪問的問題,還能不復雜化特征金字塔網絡的融合結構,生成更具有鑒別性的特征,提升不同類型的檢測器的檢測精度。
技術領域
本發明涉及數字圖像處理的技術領域,尤其涉及到一種基于新型特征金字塔網絡的圖像目標檢測方法。
背景技術
目標檢測是指對圖像中的物體同時進行位置和類別的估計,可用于現代社會如自動駕駛,安全帽檢測、行人檢測等場景中,目前主流的目標檢測算法對不同尺度的目標,尤其是小目標的檢測效果不佳。如何解決這一問題,并獲得更準確的檢測效果成為當前的研究熱點。
目前主流的目標檢測算法可大致分為兩階段檢測器和單階段檢測器。兩階段目標檢測器首先通過建議機制在特征圖上產生了一些預定義的、密集的滑動窗口,以確定目標最有可能出現的區域,稱為感興趣區域。這些感興趣區域進一步由檢測網絡處理,以邊界框和相關的目標類別概率的形式輸出目標檢測結果。最后,應用非極大值抑制算法于檢測結果,以消除重復或高度重疊的結果。單階段目標檢測器被設計為從輸入圖像中提取特征后直接在建議框中預測檢測結果,先將圖像輸入到特征提取網絡,通常是一個深度卷積神經網絡,得到特征圖,然后在特征圖上產生一組密集的目標建議框并與標注框匹配來進行采樣和標記,最后將標記的建議框輸入到分類網絡和回歸網絡中進行訓練。這兩類檢測器對固定尺度的目標可以取得較好的檢測效果,但對于不同尺度的目標,尤其是小目標,檢測精度會大大降低。
為了改善對不同尺度的目標的檢測效果,He等人提出特征金字塔網絡(FPN),其通過一種自上而下的融合路徑和橫向連接的方法構建了一個特征圖金字塔,該特征圖金字塔結合了低分辨率、強語義的特征和高分辨率、弱語義的特征,輸出五個級別的特征圖,每個級別的特征圖尺度不同,但都包含豐富的語義信息,檢測器同時在這五個特征圖對目標進行預測,從而改善對不同尺度目標的檢測效果。但這種方法對相鄰等級的特征圖只是簡單地通過最近鄰插值法縮放到相同的尺度然后進行相加融合,沒有考慮不同等級的特征圖之間存在的語義差異,導致融合時會產生冗余甚至錯誤的信息,容易引發混疊效應導致檢測效果不佳;另一方面,采用的自上而下的漸進式融合結構會使得包含目標空間結構細節的低級特征信息只能局限在最后一個融合階段被訪問,而包含完整目標上下文信息的高級語義信息被逐漸傳輸到較淺的層從而被稀釋。
在FPN的基礎上,L i u等人提出了PAFPN,在FPN中添加了自下而上的融合路徑,有效緩解了高級語義信息被稀釋與低級空間結構信息局限訪問的問題,但兩次的漸進式融合結構將引發更嚴重的混疊效應且使融合結構變得復雜;Tan等人提出了BiFPN,通過雙向跨尺度連接和加權特征融合獲得更好的檢測效果,但每個等級的特征圖都與其他等級的特征圖連接會使特征金字塔網絡的融合結構變得更加復雜;Pang等人提出了Ba l anced FPN,通過將所有等級的特征圖縮放到中間等級特征圖的大小相加取平均,并引入了注意力模塊對融合特征進行細化,可以綜合性地平衡各等級特征圖上的各類特征信息,但沒有針對性地考慮各級特征圖上的特征信息。
發明內容
本發明的目的在于克服現有技術的不足,提供一種基于新型特征金字塔網絡的圖像目標檢測方法,不僅能夠有效解決傳統特征金字塔網絡融合結構所引發的混疊效應、高級語義信息被稀釋和低級空間信息局限訪問的問題,還能不復雜化特征金字塔網絡的融合結構,生成更具有鑒別性的特征,對不同類型的目標檢測器的檢測精度皆可提升。
為實現上述目的,本發明所提供的技術方案為:
一種基于新型特征金字塔網絡的圖像目標檢測方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210048960.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:衛星遙測壓縮編解碼方法和系統
- 下一篇:一種城市燃氣全壓力等級高精度仿真方法





