[發明專利]一種針對圖像樣本不平衡的數據增強方法在審
| 申請號: | 202011160209.6 | 申請日: | 2020-10-27 |
| 公開(公告)號: | CN112270653A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 徐新勝;李晗 | 申請(專利權)人: | 中國計量大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T3/40 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310018 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 圖像 樣本 不平衡 數據 增強 方法 | ||
本發明公開了一種針對圖像樣本不平衡數據集的數據增強方法RFCAP(Random Feature Cropping and Patching,RFCAP)。該方法主要針對小樣本且各樣本量比例不平衡的圖像數據集。基于各樣本在數據集中的比例,使用隨機函數控制數據增強過程中各樣本量的比例保持平衡。通過圖像隨機裁剪與拼接生成新的數據集對原數據集進行擴充。通過RFCAP方式進行數據增強后,通過該數據集訓練得到的模型泛化能力強,且能有效避免在訓練過程中對某一類特征容易出現過擬合的情況。
技術領域:
本申請涉及數字圖像處理、圖像變換、圖像檢測領域,特別涉及圖像數據增強方面。
背景技術:
深度卷積神經網絡(CNN)由于參數眾多和豐富的表達能力,在圖像分類和圖像處理任務中取得了顯著成效。然而,具有大量參數的CNN存在過度擬合的風險,造成這一風險的原因之一在于數據集。數據集中若樣本量過少或各樣本量之間比例不平衡,都可能造成基于此類數據集訓練得到的CNN網絡過擬合或泛化能力不強。數據增強被用來解決這個問題。常見的數據增強方式有圖像翻轉、調整圖像大小、隨機裁剪和顏色轉換等。
目前圖像數據增強方法基本只是對小樣本平衡數據集進行處理,沒有一種針對樣本不平衡的圖像數據增強方法。若樣本不平衡,即使數據集非常大,通過該數據集訓練出的網絡對數據集中樣本量小的特征仍會出現過擬合情況,訓練出的網絡泛化能力不強。
發明內容:
本發明目的在于針對小樣本且樣本量不平衡的圖像數據集,提出一種針對圖像樣本不平衡的數據增強方法(Random Feature Cropping and Patching,RFCAP)。
本發明是通過以下技術方案來實現的:一種針對圖像樣本不平衡的數據增強方法。
具體包括的步驟:
1、一種針對圖像樣本不平衡的數據增強方法,具體步驟如下:
(1)分析圖像數據集,將數據集劃分為包含特征的數據集和不包含特征的數據集,統計包含特征數據集中各樣本比例。對整個數據集進行圖片翻轉、平移、旋轉、色域變換、增加噪聲等基礎數據增強操作。
(2)劃分特征圖像與非特征圖像選取比例,構建隨機函數A。
(3)根據樣本比例計算各樣本被選取的概率,通過算出各樣本的被選概率構建隨機函數B,通過隨機函數A、B選取4張圖像。
(4)使用改進的標準分布計算圖像拼接點。改進方法為標準分布中加入隨機變量t,限制標準分布取到邊界點。
(5)將特征填補位置劃分為5個位置,構建隨機函數C選取特征填補位置。
(6)使用隨機函數C剪切4張圖像,拼接得到一張新圖像。
2、一種針對圖像樣本不平衡的數據增強方法,其特征在于,步驟(1)中,不同于一般數據增強中隨機選取圖像、裁剪圖像后拼接的方法,該方法在使用時需要根據數據集中不同樣本量在數據集中的比例進行后續隨機函數的設定。在統計樣本類別后,對樣本圖像進行組合基礎的數據增強操作,對原本數據集進行第一次擴容。
3、一種針對圖像樣本不平衡的數據增強方法,其特征在于,步驟(2)中,在拼接特征圖像的同時,增加非特征(不包括特征)圖像或其他無關類別的圖像。通過加入無關圖像和非特征圖像,可強化通過該數據集訓練得到網絡的魯棒性,泛化模型檢測能力,避免小樣本數據集易過擬合問題。劃分非特征圖像與特征圖像拼接的比例,構建隨機函數A。通過隨機函數A保證在選取圖像的同時能夠使特征圖像與非特征圖像比例為1:1,同時保證在該比例下圖像選取的隨機性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國計量大學,未經中國計量大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011160209.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





