[發明專利]一種基于梯度平均的長尾目標檢測方法在審
| 申請號: | 202110206632.3 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN112861982A | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 楊航;楊海東;黃坤山 | 申請(專利權)人: | 佛山市南海區廣工大數控裝備協同創新研究院;佛山市廣工大數控裝備技術發展有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州科沃園專利代理有限公司 44416 | 代理人: | 馬盼 |
| 地址: | 528200 廣東省佛山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 梯度 平均 長尾 目標 檢測 方法 | ||
本發明公開了一種基于梯度平均的長尾目標檢測方法,包括以下步驟:S1、獲取圖像數據集,并對圖像數據集進行圖像增強處理;S2、采用預訓練模型在所述訓練集上訓練,得到初始目標檢測模型;S3、對初始模型進行訓練,得到最終目標檢測模型;S4、將待目標檢測的圖片輸入至所述最終目標檢測模型,得到所述圖片的正常類別以及長尾類別的識別結果,完成長尾目標檢測。本發明能顯著提升各種框架的尾部類別識別準確率。
技術領域
本發明涉及機器學習技術領域,具體涉及一種基于梯度平均的長尾目標檢測方法。
背景技術
近年來,由于深度學習和卷積神經網絡(CNN)的出現,計算機視覺界見證了物體識別的巨大成功。目標識別是計算機視覺中的一項基本任務,在重新識別、人體姿態估計和目標跟蹤等相關任務中起著核心作用。
如今,大多數用于通用對象識別的數據集,如Pascal VOC和COCO,主要收集常見的類別,每個類都有大量的注釋。然而,當涉及到更實際的場景時,不可避免地會出現類別頻率長尾分布的大型詞匯表數據集(例如LVIS)。類別的長尾分布問題對目標檢測模型的學習是一個很大的挑戰,特別是對于樣本很少的類別。對于一個類別,其他類別包括背景的所有樣本都被視為負樣本。因此,在訓練過程中,少數類別容易被大多數類別(樣本數量大的類別)所壓倒,并傾向于被預測為否定的類別。因此,在這樣一個極不平衡的數據集上訓練的傳統的物體探測器會大大下降。
發明內容
針對現有技術的不足,本發明的目的旨在提供一種基于梯度平均的長尾目標檢測方法。
為實現上述目的,本發明采用如下技術方案:
一種基于梯度平均的長尾目標檢測方法,包括以下步驟:
S1:獲取符合長尾分布的圖像數據集,并對所述圖像數據集進行圖像增強處理,得到圖像增強數據集,將所述圖像增強數據集劃分為訓練集和測試集;
S2:采用預訓練模型在所述訓練集上訓練,得到初始目標檢測模型;
S3:用所述初始目標檢測模型在訓練集上進行初步檢測得到初步檢測結果,根據初步檢測結果的表征在初始目標檢測模型中定義出類別分類器,根據類別分類器的正梯度和負梯度的累計梯度比對類別分類器進行加權,同時在類別分類器上增加一個檢測客觀性的分支,得到新初始目標檢測模型,將所述新初始目標檢測模型在訓練集上進行訓練,得到最終目標檢測模型;
S4:將待目標檢測的圖片輸入至所述最終目標檢測模型,得到所述圖片的正常類別以及長尾類別的識別結果,完成長尾目標檢測。
進一步地,所述數據集為LVIS數據集。
進一步地,所述步驟S1還包括:對所述訓練集的圖片進行旋轉,產生四張不同角度的子圖片,再用尺寸變換和二值分割的方法對所述子圖片進行圖像增強處理。
進一步地,所述步驟S2還包括:采用Faster R-CNN作為原始目標檢測模型,原始目標檢測模型中的主干卷積網絡在ImageNet上進行預訓練,得到所述預訓練模型,所述預訓練模型為Inception-Resnet-V2。
進一步地,所述Inception-Resnet-V2模型包括stem結構、Inception-resnet-A結構、Inception-resnet-B結構和Inception-resnet-C結構。
進一步地,所述步驟S2還包括:對所述預訓練模型進行微調,將所述預訓練模型的權重衰減設為0.0001,批處理大小為16,使用動量為0.9的SGD優化器訓練30輪,前20輪學習率設為1e-4,后面10輪由1e-5遞減為1e-6,采用微調后的預訓練模型在訓練集上進行訓練,得到所述初始目標檢測模型。
進一步地,所述步驟3還包括:所述類別分類器的輸出zj相對于損失梯度L的正梯度的計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山市南海區廣工大數控裝備協同創新研究院;佛山市廣工大數控裝備技術發展有限公司,未經佛山市南海區廣工大數控裝備協同創新研究院;佛山市廣工大數控裝備技術發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110206632.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多足機器人
- 下一篇:故障汽車配件的報價展示方法、裝置及電子設備





