[發明專利]一種基于改進的RetinaNet小目標檢測方法有效
| 申請號: | 202110344831.0 | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN113159063B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 任利;唐昊;賈宇明;賈海濤;許文波;毛晨;鮮維富;田浩琨 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06V10/44 | 分類號: | G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06T3/40 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 retinanet 目標 檢測 方法 | ||
本發明公開了一種基于改進RetinaNet的小目標檢測技術。該發明在許多基于深度學習的目標檢測模型都具有一定的實用性,該專利以行人與車輛檢測為說明案例。行人與車輛的檢測在計算機視覺的實際較為廣泛,且兩類目標都呈現出目標尺寸下、檢測場景復雜的特點。針對檢測場景復雜的問題,在RetinaNet模型結構中的FPN加入了多層融合模塊,多層融合可以一定程度解決特征金字塔結構中頂層語義信息被稀釋的問題;針對小目標的問題,由于多尺度檢測中小目標在特征層的選擇靈活性較低,較大程度上依賴金字塔底層的細節信息,利用超分辨SR技術對底層特征信息進行補償,使底層的細節信息和紋理信息等更加豐富。基于改進后的RetinaNet算法模型能夠精準識別小尺寸目標,且模型也取得較高檢測精度。
技術領域
本發明涉及深度學習中的目標檢測領域,針對小目標檢測尤其是行人與車輛檢測技術。
背景技術
隨著計算機視覺技術的發展與硬件設備性能的提高,目標檢測技術在生產生活運用度大幅提高,特別是行人與車輛檢測是當今最為常見的檢測運用場景。如圖1所示,行人與車輛兩類目標在實際檢測場景出通常呈現出目標尺寸小、場景環境復雜的特點,傳統依靠人眼對監控視頻進行定位與排查效率低下,且準確度不高,易出現漏檢誤檢等現象。此外人眼篩查無法滿足實時監控與檢測的要求。因此行人與車輛檢測就顯得十分重要。
常見的檢測算法通常分為以下幾類:
(1)基于人工提取特征的目標檢測算法:該類算法主要包括HOG、SIFT、SURF以及DPM等;
(2)基于卷積神經網絡的目標檢測算法:該類算法又可細分為兩類,一類為單階段目標檢測算法,包括SSD、YOLOV3、RetinaNet等;另一類則是雙階段檢測算法,包括SPPNet以及RCNN系列模型。
隨著深度學習的不斷進步和發展,其在生產生活等領域的應用越來越廣泛,尤其是目標檢測技術,出現了一批性能優秀的檢測框架,但對于小目標及復雜場景的檢測一致是該領域的一大難題。復雜場景精測結果不理想及小目標檢測精度低的根本原因在于不同尺度的特征金字塔層級中的信息沒有得到高效合理地利用。本發明對常見的FPN特征金字塔結構進行優化,并對小目標檢測進行特殊改進,本發明在各類檢測算法中具有一定的通用性。
發明內容
為了克服上述現有技術的不足,本發明提出了一種基于改進的RetinaNet小目標檢測技術。該技術引用了深度學習中性能較強的目標檢測框架RetinaNet,并針對特征稀釋和小目標問題進行了進一步的改進。
本發明所采用的技術方案是:
步驟1:特征提取主干網絡采用Resnet-101,包括Conv1、Conv2_x、Conv3_xConv4_x、Conv5_x(簡記C1,C2,C3,C4,C5)五個不同尺度的采樣層,將每層最后一個殘差塊的輸出特征圖利用1×1的卷積進行通道數統一,統一后的特征圖分別記為M2,M3,M4,M5;
步驟2:將M5經過3×3卷積消除融合帶來的混疊效應,生成特征金字塔的最頂層特征層,記作P5,將M5經兩倍上采樣,與M4逐像素相加,再經過3×3卷積消除融合帶來的混疊效應生成特征圖,記為P4。
步驟3:該步驟為專利的核心步驟之一,將C5和C4經過1×1卷積處理后的特征層將其尺寸改變直與C3一致大小,并與C3進行通道拼接得到全新的多層特征F3,并將通道重新排列,然后利用1×1卷積減少特征通道數,并將其與經過上采樣的M4逐像素相加融合,得到P3;
步驟4:將P3通過語義內容提取器進行提取,將提取到的特征信息通過接著通過亞像素卷積操作可以將內容提取器提取到的特征的分辨率提升一倍,其尺寸大小在亞像素卷積操作完成后與M2的尺寸大小一致,接著將P3與M2進行融合得到P2,通過紋理提取器進行進一步提取,并與亞像素卷積的輸出結果進行融合,得到最終的P2;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110344831.0/2.html,轉載請聲明來源鉆瓜專利網。





