[發(fā)明專利]一種優(yōu)化SSD檢測模型訓練方法及小目標檢測方法在審
| 申請?zhí)枺?/td> | 202210330727.0 | 申請日: | 2022-03-30 |
| 公開(公告)號: | CN114821265A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設計)人: | 強俊;劉無紀;管萍;李習習;杜云龍;肖光磊;吳維 | 申請(專利權(quán))人: | 安徽工程大學 |
| 主分類號: | G06V10/82 | 分類號: | G06V10/82;G06V10/774;G06V10/80;G06V20/17;G06V10/764;G06V10/776;G06N3/04;G06N3/08 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 方昊 |
| 地址: | 241000 *** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 優(yōu)化 ssd 檢測 模型 訓練 方法 目標 | ||
本說明書一個或多個實施例提供的一種優(yōu)化SSD檢測模型訓練方法及小目標檢測方法,將SSD檢測模型中的VGG16網(wǎng)絡作為主網(wǎng)絡,再利用殘差網(wǎng)絡對于特征信息表達能力強的優(yōu)勢,引入ResNet50網(wǎng)絡作為輔助主網(wǎng)絡,以提升網(wǎng)絡的特征表達能力,將VGG16網(wǎng)絡卷積后獲得的卷積數(shù)據(jù)與ResNet50網(wǎng)絡卷積后獲得的卷積數(shù)據(jù)進行特征融合,將融合后的卷積數(shù)據(jù)重新進行卷積,直至達到預設次數(shù),然后將融合數(shù)據(jù)輸入到SSD后續(xù)網(wǎng)絡中進行分類和檢測,獲得改進的SSD檢測模型,再對SSD檢測模型進行測試,直至損失函數(shù)趨于穩(wěn)定,最終獲得優(yōu)化SSD檢測模型,可以在檢測速度快的同時提高SSD網(wǎng)絡對于小目標的檢測能力。
技術(shù)領域
本說明書一個或多個實施例涉及機器視覺、圖像處理技術(shù)領域,尤其涉及一種優(yōu)化SSD檢測模型訓練方法及小目標檢測方法。
背景技術(shù)
近年來,無人機檢測技術(shù)開始廣泛應用在真實交通場景中,車輛和行人檢測作為無人機檢測技術(shù)的重要組成部分,具有重要研究意義。
迄今,目標檢測方法通??梢苑譃閭鹘y(tǒng)的機器學習方法和深度學習方法。傳統(tǒng)的機器學習方法均是基于手工設計的,加之特征提取的過程過于復雜,因此這些方法常常存在泛化能力差,檢測速度慢,檢測精度低等問題,難以適應不同場景的檢測任務。
目前,基于深度卷積網(wǎng)絡的目標檢測方法通常分為:基于Two-Stage的檢測方法和基于Single-Stage的檢測方法。基于Two-Stage的檢測方法中以Faster R-CNN性能最為優(yōu)異,該網(wǎng)絡引入了一個區(qū)域建議網(wǎng)絡(RPN),它可以同時預測每個位置的目標邊界和目標得分,經(jīng)過端到端訓練,生成高質(zhì)量的區(qū)域建議,提高網(wǎng)絡的檢測精度,但Faster R-CNN網(wǎng)絡結(jié)構(gòu)復雜,檢測速度十分緩慢??紤]到效率的問題,Single-Stage方法隨后被提出,其代表方法是YOLO和SSD(Single Shot MultiBox Detector)。YOLO使用了全連接網(wǎng)絡,這會導致空間信息丟失、定位錯誤和目標漏檢等問題,尤其對小目標的檢測效果較差,影響最終的檢測精度。SSD借用Faster R-CNN中的Anchor思想,并且使用多個不同尺度的特征圖進行檢測,由于各個特征圖的感受視野不同,所以SSD可以很好地適應不同大小目標的檢測,但是SSD的淺層特征圖語義信息較差,因此SSD對小目標的檢測效果并不理想。
發(fā)明內(nèi)容
有鑒于此,本說明書一個或多個實施例的目的在于提出一種優(yōu)化SSD檢測模型訓練方法及小目標檢測方法,能夠有效提高小目標檢測的檢測精度。
基于上述目的,本說明書一個或多個實施例提供了一種用于檢測小目標的優(yōu)化SSD檢測模型訓練方法,包括:
獲取歷史圖像;
將歷史圖像劃分為訓練集和測試集;
將訓練集中的歷史圖像分別輸入VGG16網(wǎng)絡和ResNet50網(wǎng)絡中進行卷積,分別獲得VGG16網(wǎng)絡圖像初次卷積數(shù)據(jù)和ResNet50網(wǎng)絡圖像初次卷積數(shù)據(jù);
將所述VGG16網(wǎng)絡圖像初次卷積數(shù)據(jù)和ResNet50網(wǎng)絡圖像初次卷積數(shù)據(jù)進行特征融合,獲得融合后的VGG16網(wǎng)絡圖像初次融合數(shù)據(jù);
將所述VGG16網(wǎng)絡圖像初次融合數(shù)據(jù)和ResNet50網(wǎng)絡圖像初次卷積數(shù)據(jù)返回執(zhí)行分別輸入VGG16網(wǎng)絡和ResNet50網(wǎng)絡中進行卷積的步驟,直至達到預設卷積次數(shù),獲得VGG16網(wǎng)絡圖像融合數(shù)據(jù);
將所述VGG16網(wǎng)絡圖像融合數(shù)據(jù)輸入到SSD后續(xù)網(wǎng)絡中進行分類和檢測,獲得改進的SSD檢測模型;
用測試集對改進的SSD檢測模型進行測試,計算損失函數(shù),與前一次訓練得到的損失函數(shù)比較,若損失函數(shù)小于前一次訓練的損失函數(shù),則返回執(zhí)行將訓練集中的歷史圖像分別輸入VGG16網(wǎng)絡和ResNet50網(wǎng)絡中進行卷積的步驟,直至損失函數(shù)趨于穩(wěn)定,獲得的SSD檢測模型為優(yōu)化SSD檢測模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽工程大學,未經(jīng)安徽工程大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210330727.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





