[發明專利]一種不完備數據集中平衡輸入數據類別多目標檢測方法有效
| 申請號: | 202011323339.7 | 申請日: | 2020-11-23 |
| 公開(公告)號: | CN112633319B | 公開(公告)日: | 2022-11-22 |
| 發明(設計)人: | 楊靜;李少波;吉曉陽;楊觀賜;柳庭卿;白強 | 申請(專利權)人: | 貴州大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京翔石知識產權代理事務所(普通合伙) 11816 | 代理人: | 李勇 |
| 地址: | 55002*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 完備 數據 集中 平衡 輸入 類別 多目標 檢測 方法 | ||
本發明涉及一種不完備數據集中平衡輸入數據類別多目標檢測方法,本發明通過運用Batch Size平衡數據集類別方法處理因不平衡數據引起模型訓練過程中的不穩定性挑戰,在不影響原始數據分布的情況下,基于訓練數據集類別分布情況平衡Batch Size的輸入,使神經網絡在每次迭代過程的數據類別均衡并采用多策略的Batch Normalization的方法去平衡訓練過程中每個類別的輸入數據,確定訓練過程中的迭代次數,減少模型在訓練過程中過學習和欠學習的情況,將利普希茨連續函數與深度學習的多策略Batch Normalization平衡輸入數據方法進行結合,建立滿足利普希茨連續函數等式,分析不平衡數據集的正負樣本在輸入給神經網絡模型中,提高檢測模型的穩定性,解決數據不平衡分布問題。
技術領域
本發明涉及圖像數據采集技術領域,尤其涉及一種不完備數據集中平衡輸入數據類別多目標檢測方法。
背景技術
近年來,隨著深度學習得發展,目標檢測模型已經取得了較大的進步。主流的目標檢測方法包括Two-stage detectors和One-stage detectors方法。Two-stage detectors目標檢測網絡首先擬合一系列樣本候選區域,再通過卷積神經網絡對候選區域進行樣本分類,這類算法的識別錯誤率低,速度慢。相較于Two-Stage detectors方法,One-stageDetectors方法不需要候選區域生成階段,直接在候選區域中產生檢測對象的類別概率和位置坐標值,因此有著比Two-Stage Detectors更快的檢測速度。但單張圖片中存在多個類別,且目標類別間存在數量不均衡問題,使深度學習模型因為輸入數據不同而造成訓練過程中出現梯度不穩定現象,甚至造成過學習和欠學習等問題。
樣本數量類別不均衡問題使得模型在訓練過程中存在嚴重的不穩定性。專家、學者們提出了許多改進方法來緩解該問題,大致可分為3類:一是通過減少多數類樣本的欠采樣方法和通過增加少數類樣本的過采樣方法;二是優化神經網絡運算過程,如Batch-Normalization和優化損失函數等方法。三是采用數據擴增的方法擴增訓練數據,主要包括:圖像空間的數據擴增和特征空間/屬性引導的數據擴增;盡管以上方法都不同程度上取得了較好得實驗結果,但通過優化損失函數的方法是獨立與數據的,缺少對數據屬性和數據分布的探索。雖然采用過采樣和欠采樣的方法平衡了不同類別數據的分布,但過采樣方法只是重復了正例樣本的分布,這種重復采樣方法容易引起對正例樣本的過擬合,而欠采樣方法拋棄了大部分反例數據,可能引起模型的偏差過大。過采樣和欠采樣的方法都影響了原有的數據分布;在訓練過程中采用數據擴增的方法有效的增加了訓練數據集,減少了因數據不均衡而引起的不穩定情況,但沒有改變原有數據不平衡分布。
發明內容
為此,本發明提供一種不完備數據集中平衡輸入數據類別多目標檢測方法,用以克服現有技術中數據不平衡分布的問題。
為實現上述目的,本發明提供一種不完備數據集中平衡輸入數據類別多目標檢測方法,其為規范化Batch Size輸入大小的過程,包括:
步驟a,對輸入的數據進行清洗,對數據命名進行規范,檢查圖片文件所對應的標簽文件是否為空,以確保每張圖片中具有類別實體,沒有損壞的文件;
步驟b,依次讀取數據集中的Xml文件,獲得每張圖片中的圖片類別,并按照不同的類別對圖片進行排序;
步驟c,計算訓練數據集中Ci個類別的圖片數量,包含Bounding Box數量最少的類別(Ci)min和Bounding Box數據量最多的類別(Ci)max以及其它類別中Bounding Box的數量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州大學,未經貴州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011323339.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





