[發明專利]一種基于SSD網絡的小目標檢測方法在審
| 申請號: | 202011468851.0 | 申請日: | 2020-12-15 |
| 公開(公告)號: | CN112580664A | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 李成嚴;趙帥;車子軒 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150080 黑龍江省哈*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ssd 網絡 目標 檢測 方法 | ||
本發明提出了一種基于SSD的小目標檢測方法,通過多尺度特征融合、學習具有大感受野的高分辨率特征、引入注意力機制等特征增強的方式豐富小目標的特征信息,提高小目標的特征質量,通過Anchor?object匹配策略聯合分類與定位的置信度去學習Anchor,解決每個被分配的Anchor獨立的監督網絡學習以進行分類與定位與分類與定位之間沒有交互的問題,來提升小目標的檢測精度以及定位精度,此外,數據集樣本的多樣性能夠有效的提升模型對小目標檢測的精度和泛化能力,所以本發明在數據樣本的采集上,參考了不同光照、不同姿態及遮擋程度等眾多影響因素。
技術領域
隨著計算機技術的發展和計算機視覺原理的廣泛應用,利用計算機圖像處理技術對目標實時跟蹤變得越來越熱門,對目標進行動態實時跟蹤定位在智能化交通系統、智能監控系統、軍事目標檢測及醫學等方面具有廣泛的應用價值,本發明涉及圖像處理領域及目標檢測領域,針對目標檢測領域中小目標檢測效果不佳的問題,提出了一種提升小目標檢測精度的方法。
背景技術
目標檢測技術分為傳統方法和深度學習的方法,傳統的目標檢測方法包括HOG特征法、Haar-Like特征法、LBP特征法,這些方法特征層很淺,現已被深度學習方法取代,在深度學習領域,基于卷積神經網絡(Convolution Neural Network,CNN)的方法具有特征層次深,檢測準確率高,魯棒性好的優點。
一般來說,基于深度學習的目標檢測方法分為兩類,一類是基于候選區域的R-CNN系兩階段方法,需要先產生候選區域,然后再在候選區域上做分類與回歸,R-CNN首先利用Selective Search技術對輸入圖像提取生成約2000個建議框,然后使用AlexNet特征提取網絡對建議框進行特征提取,最后使用SVM分類器確定檢測目標的類別,使用回歸器確定目標的位置,SPP-Net改進了R-CNN對所有的建議框使用卷積神經網絡來提取特征造成的嚴重耗時問題,對整張輸入圖片僅進行一次卷積操作,大大降低了運算量,以VGG-16為基準網絡的Fast R-CNN借鑒了SPP-Net的思想將SPP層簡化為ROI Pooling單層結構,引入softmax函數和SVD分解,替代了SVM分類器,將分類和回歸合并成一個問題,在提高檢測速度的同時提高了檢測精度,Faster R-CNN真正實現了網絡模型的端到端訓練,設計了區域生成網絡(RPN)來生成候選區域,并將候選區域的生成、特征的提取、目標分類和位置回歸整合到了一個模型中,R-FCN使用ResNet作為特征提取網絡,在ROI Pooling層后改用全卷積神經網絡替換全連接層,減少了參數量,為解決Faster R-CNN存在的圖像分類和目標檢測的平移不變性的矛盾引入了位置敏感得分圖,以ResNeXt-101為基準網絡的Mask R-CNN加入一個用于預測目標掩碼的Mask預測分支,以完成實例分割任務,利用雙線性差值的方法設計了ROI Align替代ROI Pooling,使得為每個ROI取得的特征能夠更好地對齊原圖上的ROI區域,提高了掩碼的精確度,總體而言,兩階段目標檢測的檢測精度在不斷提升,但是檢測速度普遍較慢。
另一類方法是僅僅使用一個CNN網絡直接預測不同目標的類別與位置,YOLOv1只需要對輸入圖像進行一次處理,即可同時得到目標的位置和類別,檢測速度得到了大大的提升,但是,YOLOv1網格的劃分策略生成的先驗框個數較少,對小目標和密集目標的檢測精度較差,定位誤差也較大,以Darknet-19為基準網絡的YOLOv2,引入了批量歸一化(BN)操作,舍棄了Dropout操作,Anchor Boxes來預測邊界框,提升了YOLOv1目標檢測的精度,以Darknet-53作為基準網絡的YOLOv3,該網絡吸收了FPN的思想有效提高了網絡對小目標的檢測效果,使用二元交叉熵損失函數實現了對同一個邊界框多個類別的預測,以CSPDarknet53為基準網絡的YOLOv4,添加了SPP模塊來增大感受野,同時使用PANet替換YOLOv3中的FPN來進行多通道特征的融合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011468851.0/2.html,轉載請聲明來源鉆瓜專利網。





