[發明專利]一種實時目標檢測的方法、系統及裝置在審
| 申請號: | 201811623883.6 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN109800770A | 公開(公告)日: | 2019-05-24 |
| 發明(設計)人: | 葛海玉;楊琳;郝祿國;龍鑫;曾文彬;李偉儒 | 申請(專利權)人: | 廣州海昇計算機科技有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 胡輝 |
| 地址: | 510663 廣東省廣州市高新技術產業開*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征圖 卷積處理 通道信息 實時目標檢測 系統及裝置 反卷積處理 第二空間 第一空間 空間信息 目標檢測 邊界框 準確率 檢測 分類 圖片 預測 應用 | ||
本發明公開一種實時目標檢測的方法、系統及裝置,其中方法步驟為:獲取待檢測的圖片,對圖片進行第一卷積處理獲得第一特征圖;結合第一特征圖、第一空間信息和第一通道信息獲得第二特征圖;對第二特征圖進行第二卷積處理獲得第三特征圖;結合第三特征圖、第二空間信息和第二通道信息獲得第四特征圖;對第四特征圖進行第三卷積處理獲得第五特征圖;依次對第五特征圖進行多次反卷積處理后,獲得第六特征圖、第七特征圖和第八特征圖,以及通過結合特征圖獲取第九特征圖和第十特征圖,對第六特征圖、第九特征圖和第十特征圖進行分類和邊界框的預測,本發明通過結合不同特征圖以及空間信息和通道信息來提高檢測準確率,可廣泛應用于目標檢測領域。
技術領域
本發明涉及目標檢測領域,尤其涉及一種實時目標檢測的方法、系統及裝置。
背景技術
隨著深度學習的不斷發展,在自然語言處理以及目標檢測和分類方面也取得了不錯的進步。其中目標檢測主要分為兩分支,一分支是具有兩階段的目標檢測,如:RCNN系列(RCNN、Fast RCNN以及RFCN等)這些目標檢測方法分為兩個階段,在第一階段,通過算法或區域提議網絡生成高質量的候選框。然后在第二階段設計子網絡對這些候選框進行分類和邊框回歸,因此由于這類檢測方法分為兩階段所以在檢測速度方面存在缺陷,達不到實時的效果。另一分支則是單階段的目標檢測方法(如YOLO、SSD以及DSOD等),因為沒有產生候選框階段所以相對于前一種方法來說準確率相對較差,但其檢測速度十分優秀可以達到實時的檢測。
目前基于單階段的目標檢測方法的改進主要是通過結合不同特征圖的信息或者采用更復雜的網絡結構來獲取具有高語義的特征信息,例如:在YOLO方法中直接在最后的卷積層上進行邊界框回歸的目標檢測,SSD方法則是在YOLO方法的基礎上提出來的,該方法是結合最后幾個卷積層進行預測,因而有更高的準確率。DSSD方法則是在SSD的改進,通過采用更復雜的網絡結構(ResNet)進行特征提取,并結合反卷積層獲取更多的語義信息。在Single-Shot Bidirectional Pyramid Networks的方法中則采用了雙向的特征金字塔網絡結構,結合了底層和高層之間的特征信息,并采用了一個級聯的錨優化模塊來提高候選框的定位能力。
上述大多數的改進方法都是在犧牲檢測速度的基礎上提高其檢測精度,例如:1、采用更復雜的網絡模型進行特征提取的方法。在DSSD方法中,因其用于特征提取的網絡結構ResNet相對復雜,引入了較多的參數所以在檢測幀率上會大幅度下降;2、通過引入新的模塊來解決單階段目標檢測的正負樣本失衡問題。在Single-Shot BidirectionalPyramid Networks方法中便通過添加一個新的級聯的錨優化模塊來提高方法的定位準確率,同樣在Single-shot Refinement Neural Network方法中也引入了類似的錨優化模塊來去除一些負樣本。相比于通過引入新的損失函數來緩解正負樣本嚴重失衡問題,添加新模塊的這種方法也增加了訓練參數,從而也會使檢測速率極大地下降。
名詞解釋:
CoupleNet:復合網絡。
CBAM:(Convolutional Block Attention Module)卷積塊注意模塊。
DSOD:(Deeply Supervised Object Detectors)強監督目標檢測器。
DSSD(Deconvolutional Single Shot Detector)反卷積的單次多邊界盒檢測器。
Focal Loss:聚焦損失。
FPN:(Feature Pyramid Networks)空間金字塔網絡。
Fast RCNN:基于區域提議的快速卷積神經網絡。
IOU:(Intersection over Union)重疊度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州海昇計算機科技有限公司,未經廣州海昇計算機科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811623883.6/2.html,轉載請聲明來源鉆瓜專利網。





