[發明專利]一種基于可變形部分的完全卷積網絡進行目標檢測的方法在審
| 申請號: | 201711022519.X | 申請日: | 2017-10-27 |
| 公開(公告)號: | CN107808167A | 公開(公告)日: | 2018-03-16 |
| 發明(設計)人: | 夏春秋 | 申請(專利權)人: | 深圳市唯特視科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市高新技術產業園*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 變形 部分 完全 卷積 網絡 進行 目標 檢測 方法 | ||
技術領域
本發明涉及目標檢測領域,尤其涉及一種基于可變形部分的完全卷積網絡進行目標檢測的方法。
背景技術
近幾年,基于深度卷積網絡的深度學習在一些視覺領域獲得廣泛的應用,主要用于圖像分割、語義分割以及目標檢測等領域。目標檢測成為人工智能領域的關鍵技術之一,并且在視覺導航、智能交通、視頻檢索及壓縮、三維重構、安全監控和醫療等方面有廣闊應用,此外,在交通流量控制、車輛異常行為監測等民用大場景領域都有廣泛應用。現階段常用的區域建議網絡將重點放在圖像中的感興趣的區域,對該區域進行分類和定位,該方法仍有很多不足,容易產生分類和檢測任務之間的不匹配,并且降低了特征圖的空間分辨率,使網絡對區域內的對象位置不敏感,影響準確率,因此,現有的目標檢測方法仍存在一定的局限性。
本發明提出了一種基于可變形部分的完全卷積網絡進行目標檢測的方法,以完全卷積網絡(FCN)作為骨干網絡結構,采用可變形部分RoI池,將區域建議R分成幾部分,定位這些局部對象的最佳匹配形狀,并在圖像中的相應位置對齊,預測采用兩分支對區域建議進行分類和定位來進行。本發明利用完全卷積網絡,在整個圖像的計算中共享,提供與任務相關的特征映射,采用特殊的RoI集合推斷區域位置,最終預測進行簡單的匯總,獲得分類和定位進行目標檢測。保證了分類和檢測任務之間的匹配度,同事保證了特征圖的分辨率,提高目標檢測的準確率。
發明內容
針對特征圖分辨率低以及目標檢測準確率不高的問題,本發明利用完全卷積網絡,在整個圖像的計算中共享,提供與任務相關的特征映射,采用特殊的RoI集合推斷區域位置,最終預測進行簡單的匯總,獲得分類和定位進行目標檢測。
為解決上述問題,本發明提供了一種基于可變形部分的完全卷積網絡進行目標檢測的方法,主要包括:
完全卷積特征提取(一);
基于可變形部分RoI池(二);
可變形部分的分類和定位預測(三)。
其中,可變形部分的完全卷積網絡,區域部分表征,通過優化其位置進行對齊,提高分類和定位預測,基于局部的表示對局部變換更具有不變性,部分的結構提供了有關物體幾何形狀的重要信息。
其中,完全卷積特征提取器(一),以完全卷積網絡(FCN)作為骨干網絡結構,可以在整個圖像的計算中共享,并且減少RoI層,提供與任務相關的特征映射,最終預測進行簡單的匯總(例如檢測熱圖),在可變形部分的完全卷積網絡(DP-FCN)中,采用特殊的RoI集合推斷區域位置,完全卷積結構適合于計算所有類中所有部分的響應,作為每一類的映射,相應的結構用于定位,整個圖像的完整表示(每一類的每個部分的分類和定位圖)通過向前傳遞獲得,并且在同一圖像的所有區域之間共享。
進一步地,在特征圖中對部分進行定位,對圖的分辨率有較高的要求,FCNs只包含空間層,適合保存空間分辨率,和以網絡結束的全連接層網絡不同,具體來說,如果步幅太大,部分的變形可能過于粗糙,無法正確地描述物體,通過擴大最后卷積塊上的卷積跳過池化,合并最后的三步從而減少步幅。
其中,基于可變形部分RoI池(二),目的是將區域建議R分成幾部分,重新定位這些局部對象的最佳匹配形狀,每個部分的判別局部元素建模,并在圖像中的相應位置對齊,這種基于部分變形更多的是表示不變的轉換對象,因為這部分相應定位和位置比較穩定,對于非剛性物體比較有用。
進一步地,最佳匹配形狀,通過一個尺寸為k×k規格網格對部分進行分割,對區域進行匹配,每一個點(i,j)被視為獨立的部分Ri,j,因為部分的數量(i.e.k2)作為超參數固定,可以為每一個類c每個區域(i,j)計算獲得完整的檢測熱圖zi,j,c,部分只需要在相應的地圖中進行優化;部分的變形允許部分在參考位置稍微移動(初始區域的分區),選擇最佳的潛在的位移,從選定的位置選擇池化值,部分(i,j)的池化分數和分類c是在特征映射分數最大化和參考位置位移(dx,dy)最小化的權衡:
其中,λdef代表正規化(小變形)的強度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市唯特視科技有限公司,未經深圳市唯特視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711022519.X/2.html,轉載請聲明來源鉆瓜專利網。





