[發(fā)明專利]一種基于候選區(qū)域面積和寬高的自適應特征塊提取方法在審
| 申請?zhí)枺?/td> | 202010433564.X | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111611998A | 公開(公告)日: | 2020-09-01 |
| 發(fā)明(設計)人: | 陳楚城;戴憲華 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 候選 區(qū)域 面積 自適應 特征 提取 方法 | ||
本發(fā)明涉及一種基于候選區(qū)域面積和寬高的自適應特征塊提取方法,包括:(1)利用特征提取網絡對輸入圖像進行特征提取;(2)通過特征金字塔網絡構建檢測特征圖;(3)利用區(qū)域建議網絡獲取候選區(qū)域;(4)通過自適應特征塊提取方法獲取候選區(qū)域的最終特征塊;(5)獲取檢測模型的分類誤差和回歸誤差,訓練模型;(6)利用訓練好的檢測模型獲取測試圖像的目標位置和類別。本發(fā)明的方法可以有效利用多個檢測特征圖的信息,補充感受野信息的同時獲取細節(jié)信息,從而提高檢測模型在具有懸殊寬高比的目標上的檢測性能,最終提高檢測模型的整體檢測。
技術領域
本發(fā)明涉及圖像目標檢測領域,即一種基于候選區(qū)域面積和寬高的自適應特征塊提取方法。
背景技術
近年來,深度學習技術廣泛應用于計算機視覺、自然語言處理和語音處理等多個領域中,并取得顯著的成果。其中以深度學習中的卷積神經網絡在圖像處理領域的成果尤為顯著,所取得的效果是傳統(tǒng)算法無法比擬的。后來,科研人員將深度學習技術應用于目標檢測技術中,提出一系列基于深度學習的目標檢測算法,以提高檢測模型的檢測精度或者檢測速度。科研人員為了解決目標物體的多尺度問題,提出了特征金字塔網絡結構。
特征金字塔網絡中是根據(jù)候選區(qū)域的面積大小來決定候選區(qū)域特征塊從哪個檢測特征圖中獲取。但是這種只根據(jù)候選區(qū)域面積大小的單一元素,當檢測對象中存在具有懸殊寬高比的對象,檢測模型的檢測性能往往較低。這是由于候選區(qū)域的面積大小無法全面反映具有懸殊寬高比的對象的整體信息,導致候選區(qū)域特征塊從不合理的檢測特征圖中獲取,而該檢測特征圖無法提供充足的感受野和輔助定位的細節(jié)信息,因此檢測模型的檢測性能并不理想。
發(fā)明內容
為了克服現(xiàn)有技術存在的不足,本發(fā)明提出了一種解決上述難點的基于候選區(qū)域面積和寬高的自適應特征塊提取方法。
為了實現(xiàn)以上目的,本發(fā)明提出的方法具體步驟如下:
(1)圖像劃分,將圖像劃分成訓練集和測試集兩部分,兩個部分不存在相同的圖像,訓練集用來訓練檢測模型,測試集用來評估檢測模型的性能,且訓練集和測試集中不僅包含圖像,還包含圖像中目標對象的位置信息和類別信息;
(2)圖像預處理,包括隨機上下翻轉、隨機左右翻轉和隨機光照改變等,其中隨機上下翻轉、隨機左右翻轉和隨機光照改變只針對訓練集,特別的,當進行隨機上下翻轉和隨機左右翻轉的時候,目標對象的坐標信息也需要做出相應的變化;
(3)訓練檢測模型,將經過圖像預處理后的訓練集中的圖像和標簽信息輸入到基于自適應特征塊提取的帶有特征金字塔網絡的Faster R-CNN的檢測模型中進行訓練,獲取各圖像中目標對象的預測框和類別,并與實際的標簽信息中的真實框和類別進行對比,計算出回歸損失和分類損失,其中回歸損失和分類損失包含了區(qū)域建議網絡的損失還有第二階段的損失,然后采用多學習任務的方法,利用帶動量的梯度下降算法進行訓練;
(4)測試檢測模型,將測試集中的圖像輸入到訓練好的基于自適應特征塊提取的帶有特征金字塔網絡的Faster R-CNN的檢測模型中進行檢測,獲得測試圖像中目標對象的位置和類型,并統(tǒng)計檢測模型的檢測精度。
所述步驟(3)中訓練包括構建檢測特征圖和獲取正負樣本的步驟、獲取區(qū)域建議網絡損失值的步驟、獲取候選區(qū)域的步驟、通過自適應特征塊提取方法獲取候選區(qū)域最終特征塊的步驟、獲取第二階段損失值的步驟和多任務學習的步驟。
如圖1所示,所述步驟(3)具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010433564.X/2.html,轉載請聲明來源鉆瓜專利網。





