[發明專利]目標檢測中候選框去冗余方法有效
| 申請號: | 202010426658.4 | 申請日: | 2020-05-19 |
| 公開(公告)號: | CN111582226B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 姜晶菲;竇勇;李景琳;許金偉;劉志強;趙小強;韓哲;付強;秦步月;溫冬 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/94;G06V10/82 |
| 代理公司: | 長沙中科啟明知識產權代理事務所(普通合伙) 43226 | 代理人: | 匡治兵 |
| 地址: | 410003 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 候選 冗余 方法 | ||
本發明公開了一種目標檢測中候選框去冗余方法,目的是解決去冗余時間過長的問題。技術方案是先構建由數據預處理模塊、最大值比較模塊、篩選模塊、數據恢復模塊組成的候選框去冗余加速器,篩選模塊中的交并比單元組由S個交并比單元組成,交并比單元均為九級流水結構,最大值比較模塊中的K級比較器也是一個K級流水結構,一次可以處理2k組候選框數據。數據預處理模塊對N組候選框進行預處理,最大值比較模塊、篩選模塊、數據恢復模塊并行工作,采用流水的方法對N組候選框數據進行最大值候選框選取、篩選、數據恢復。本發明既可大大加快篩選冗余候選框的速度,又解決了目前傳統非極大值抑制算法容易誤刪人臉的缺陷。
技術領域
本發明涉及一種圖像識別領域的候選框去冗余方法,尤其指目標檢測領域中的候選框去冗余方法。
背景技術
目標檢測即檢測出圖像中物體的位置和類別,比起人工檢測具有速度快,大批量等特點,具有極高的使用價值。目前目標檢測技術已經成熟應用在人臉識別,汽車自動駕駛和視頻監控中,給人們的生活、工作帶來極大便利。
在深度學習浪潮來襲前目標檢測發展緩慢,大多依靠DPM(deformable partmodel零件模型)(見文獻“Felzenszwalb P,Mcallester D,Ramanan D.Adiscriminatively trained,multiscale,deformable part model[J].Cvpr,2008,8::1-8.”即Felzenszwalb P的“一種經過鑒別訓練的、多尺度、可變形的零件模型”)HOG(Histograms of oriented gradients梯度直方圖)特征(見文獻“Dalal N,TriggsB.Histograms of oriented gradients for human detection[C]//Computer Visionand Pattern Recognition,2005.CVPR 2005.IEEE Computer Society Conferenceon.IEEE,2005,1:886-893.(2016:Google Citation:14046)”即Dalal N的“面向人類檢測的梯度直方圖”)等傳統方法來提高精度。直到在ImageNet圖像分類大賽中提出了卷積神經網絡的方法,目標檢測開始飛速發展起來。目前主流的方法有MTCNN,YOLO,RCNN,SSD,RetinaNet等,以采用MTCNN網絡的圖像識別方法為例(見文獻“Zhang K,Zhang Z,Li Z,etal.Joint Face Detection and Alignment Using Multitask Cascaded ConvolutionalNetworks[J].IEEE Signal Processing Letters,2016,23(10):1499-1503.”即Zhang K的“基于多任務級聯卷積網絡的人臉聯合檢測與對準”),如論文中第2頁所描述的,MTCNN是一個級聯神經網絡,由三個網絡即P網絡,R網絡,O網絡串聯而成。其中P網絡是一個全卷積的神經網絡結構,P網絡進行特征提取的步驟是:
1.原圖片I經過金字塔縮放后,通過10個3*3*3的卷積層,2*2的池化層操作,生成10個特征圖。
2. 10個特征圖通過16個3*3的卷積層,生成16個特征圖。
3. 16個特征圖通過32個3*3的卷積層,生成32個特征圖。
4. 32個特征圖通過2個1*1的卷積層,生成2個特征圖用于分類;同時這32個特征圖通過4個1*1的卷積層,生成4個特征圖作為回歸候選框;同時這32個特征圖通過10個1*1的卷積層,生成10個特征圖用于人臉輪廓點的判斷。
R網絡,O網絡與P網絡結構類似,基本功能相同,在邏輯上是串行的。P網絡對原圖片I進行第一次提取回歸候選框,之后將這些回歸候選框和原圖片I發送到R網絡;R網絡提取第二候選框,將第二候選框和原圖片I發送到O網絡;O網絡提取第三候選框,第三候選框作為MTCNN系統的輸出結果,即目標在原圖I中的位置。MTCNN神經網絡對原始圖像進行目標檢測的基本流程為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010426658.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種MEMS微加工傳感器陣列微結構體的方法
- 下一篇:一種發光二級管





