[發明專利]一種基于快速神經架構搜索的目標檢測方法在審
| 申請號: | 202011469675.2 | 申請日: | 2020-12-14 |
| 公開(公告)號: | CN112464960A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 張艷寧;張世周;高揚;王寧 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 金鳳 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 快速 神經 架構 搜索 目標 檢測 方法 | ||
本發明公開了一種基于快速神經架構搜索的目標檢測方法,首先定義搜索空間,搜索空間由多層特征融合模塊和檢測頭模塊組成;再構建搜索算法;將搜索算法應用在搜索空間,對原始圖像進行搜索,檢測得到原始圖像中目標的類別及位置信息。使用本發明搜索方法,可以在有限的時間和計算資源下,針對目標檢測任務定制不同計算場景下的客制化網絡模型,兼顧效率與檢測精度的平衡。
技術領域
本發明屬于計算機視覺技術領域,具體涉及一種目標檢測方法。
背景技術
目標檢測任務一直是計算機視覺領域的前沿研究熱點。其主要目的是識別并用方框標注圖像或視頻內容中的目標物體。近年來,隨著目標檢測技術的不斷發展,其已被廣泛應用于自動駕駛、道路監控、刑事偵查等各個領域。目前大多數的目標檢測方法都使用了特征金字塔結構,該結構為分層結構,可以使神經網絡模型在訓練時更容易對模型提取得到的特征進行解碼,同時針對不同類型的圖像進行分級處理,從而有助于提升網絡的分類和檢測能力。但是,類似特征金字塔結構的手工設計,在面對不同數據集與應用場景時,性能尚無法達到最優,且調整過程會消耗研究人員大量的精力,極大影響了目標檢測任務的發展。
與此同時,神經架構搜索技術也在近年來得到迅速發展,其旨在通過自動化搜索的方式,搜索針對各類視覺、語音或自然語言處理任務所需的網絡結構,達到解放人力,節省時間與計算資源的目的。
相比于傳統的人工結構設計,基于神經架構搜索技術的目標檢測網絡設計更具挑戰。它不僅需要研究人員設計一個良好的網絡搜索空間和一組基本的候選操作,如何對網絡結構進行編碼并作為強化學習的輸入,設計強化學習的獎勵函數,使得強化學習朝著檢測性能提升的方向迭代網絡,也是需要解決的難題。
發明內容
為了克服現有技術的不足,本發明提供了一種基于快速神經架構搜索的目標檢測方法,首先定義搜索空間,搜索空間由多層特征融合模塊和檢測頭模塊組成;再構建搜索算法;將搜索算法應用在搜索空間,對原始圖像進行搜索,檢測得到原始圖像中目標的類別及位置信息。使用本發明搜索方法,可以在有限的時間和計算資源下,針對目標檢測任務定制不同計算場景下的客制化網絡模型,兼顧效率與檢測精度的平衡。
本發明解決其技術問題所采用的技術方案包括如下步驟:
步驟1:定義目標檢測搜索空間;
步驟1-1:將原始圖像輸入骨干特征提取網絡,輸出c1、c2、c3、c4、c5 5個不同尺度的圖像,其中c1為原圖像;
步驟1-2:將c1、c2、c3、c4、c5輸入多層特征融合模塊,多層特征融合模塊將c1、c2、c3、c4、c5進行融合,多層特征融合模塊的輸出表示為P3、P4、P5、P6、P7,并且P3、P4、P5、P6、P7的尺度與c1、c2、c3、c4、c5的5個尺度相同;
步驟1-3:將P3、P4、P5、P6、P7分別輸入5個檢測頭模塊,經過檢測頭模塊的分類與回歸,輸出對原始圖像中目標檢測結果,包括類別及位置信息;
步驟2:構建目標檢測搜索算法;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011469675.2/2.html,轉載請聲明來源鉆瓜專利網。





