[發明專利]一種基于圖片蒸餾的通用物體檢測系統及其實現方法有效
| 申請號: | 201811150901.3 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN109344897B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 王青;趙惠;陳添水;林倞 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州容大知識產權代理事務所(普通合伙) 44326 | 代理人: | 劉新年 |
| 地址: | 510220 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖片 蒸餾 通用 物體 檢測 系統 及其 實現 方法 | ||
本發明公開了一種基于圖片蒸餾的通用物體檢測系統及其實現方法,該系統包括:Faster RCNN模型,構建Faster RCNN的網絡結構,并進行訓練,得到訓練好的Faster RCNN模型;Wae Faster RCNN檢測模型,將輸入圖像分解成兩個分辨率只有原圖一半的子圖,構建并利用Wae Faster RCNN網絡結構分別對低頻和高頻子圖進行物體檢測,將兩個子圖的檢測結果進行融合得到最終檢測結果;訓練指導單元,對Wae Faster RCNN檢測模型進行訓練,并在訓練時引入知識蒸餾機制,利用已訓練好的Faster RCNN模型的輸出作為軟目標來指導Wae Faster RCNN模型的訓練。
技術領域
本發明涉及計算機視覺技術領域,特別是涉及一種基于圖片蒸餾的通用物體檢測系統及其實現方法。
背景技術
通用物體檢測是計算機視覺領域最基礎的研究方向,它的具體任務是對給定圖像,輸出該圖像包含的物體的邊界框和類別。近年來,隨著卷積神經網絡的發展,通用物體檢測已取得重大進展。目前基于CNN的通用物體檢測方法主要分為兩種:以RCNN,FastRCNN,Faster RCNN,Mask RCNN為代表的基于分類的通用物體檢測方法和以YOLO系列、SSD為代表的基于回歸的物體檢測方法。基于分類的通用物體檢測方法一般檢測精度較高于基于回歸的通用物體檢測方法,應用較為廣泛,但其檢測速度相對較慢。
具體地說,RCNN提出應用候選框策略來解決檢測問題,即先用傳統方法對圖片預測一系列可能含有物體的候選框,再對候選框進行分類和位置微調。RCNN需要提前保存圖像的候選框且每個候選框要單獨經過網絡提取特征,占用內存大且檢測時間長;Fast RCNN采用ROI Pooling對此進行改進,使得每張圖片僅需經過網絡一次,速度有所提高,但仍然偏慢,Faster RCNN在Fast RCNN的基礎上,提出了RPN(Region Proposal Network)來提取候選框,速度較傳統方法有明顯提高,但仍遠遠不夠,Mask RCNN進一步改進Faster RCNN,添加了一個分支使用現有的檢測對目標進行并行預測,提高了對小物體的檢測精度,而且Mask RCNN的檢測速度在5fps,已經是速度比較快的基于分類的通用物體檢測框架了,但這個速度離實時檢測還有些遙遠。
發明內容
為克服上述現有技術存在的不足,本發明之目的在于提供一種基于圖片蒸餾的通用物體檢測系統及其實現方法,以提高基于分類的通用物體檢測技術的檢測速度。
為達上述及其它目的,本發明提出一種基于圖片蒸餾的通用物體檢測系統,包括:
Faster RCNN模型,用于構建Faster RCNN的網絡結構,并進行訓練,得到訓練好的Faster RCNN模型;
Wae Faster RCNN檢測模型,用于將輸入圖像分解成兩個分辨率只有原圖一半的子圖,構建Wae Faster RCNN網絡結構,利用Wae Faster RCNN網絡結構分別對低頻子圖和高頻子圖進行物體檢測,然后將兩個子圖的檢測結果進行融合得到最終檢測結果;
訓練指導單元,用于對所述Wae Faster RCNN檢測模型進行訓練,并在所述WaeFaster RCNN檢測模型訓練時引入知識蒸餾機制,利用訓練好的Faster RCNN模型的輸出作為軟目標來指導所述Wae Faster RCNN檢測模型的訓練。
優選地,所述Wae Faster RCNN檢測模型包括:
圖像分解單元,用于利用訓練好的Anto-Encoder模型將輸入圖像分解成兩個分辨率只有原圖一半的子圖,分別為低頻子圖和高頻子圖;
檢測單元,用于構建所述Wae Faster RCNN網絡結構,利用所述Wae Faster RCNN網絡結構分別對低頻子圖和高頻子圖進行物體檢測;
融合處理單元,用于對低頻子圖與高頻子圖的檢測結果進行融合,得到融合后的檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811150901.3/2.html,轉載請聲明來源鉆瓜專利網。





