[發明專利]針對目標檢測的少樣本數據擴增方法在審
| 申請號: | 202110070610.9 | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112560998A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 李學生;李晨;牟春 | 申請(專利權)人: | 德魯動力科技(成都)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 成都熠邦鼎立專利代理有限公司 51263 | 代理人: | 李曉英 |
| 地址: | 610000 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 目標 檢測 樣本 數據 擴增 方法 | ||
本發明涉及針對目標檢測的少樣本數據擴增方法,包括以下步驟:S1,定性分析目標樣本可能出現的場景以及場景的風格;S2,利用場景檢測算法和風格提取算法提取目標樣本的場景特征、風格特征;S3,利用機器學習算法對場景特征和風格特征進行聚類分析;S4,根據聚類分析結果從開源數據集中搜索具有相似場景或風格的圖片;S5,將目標樣本與從開源數據集中找出的相似圖片進行融合,制作出假樣本。本發明方法可以改變目標樣本的場景(背景),能生成更多的風格相似的假樣本,以彌補部分樣本在樣本數量上的不均衡問題,同時還能規避基于GAN網絡需要訓練等問題。本發明不僅提高了數據擴增的效率,同時也提高了就樣本的數據質量。
技術領域
本發明涉及目標檢測技術領域,尤其涉及針對目標檢測的少樣本數據擴增方法。
背景技術
數據擴增也叫數據增強,意思是在不實質性的增加數據的情況下,讓有限的數據產生等價于更多數據的價值,是目標檢測領域內常用的數據處理方法。數據擴增對提高模型精度、提高模型泛化能力具有非常重要的作用。一般來說數據增強可以分為,有監督的數據增強和無監督的數據增強方法。
一、有監督數據增強,即采用預設的數據變換規則,在已有數據的基礎上進行數據的擴增,包括幾何操作類,顏色變換類。
(1)幾何變換類即對圖像進行幾何變換,包括翻轉,旋轉,裁剪,變形,縮放等各類操作,下面展示其中的若干個操作。水平翻轉和垂直翻轉、隨機旋轉隨機裁剪變形縮放翻轉操作和旋轉操作,對于那些對方向不敏感的任務,比如圖像分類,都是很常見的操作,在caffe等框架中翻轉對應的就是mirror操作。翻轉和旋轉不改變圖像的大小,而裁剪會改變圖像的大小。
(2) 顏色變換類上面的幾何變換類操作,沒有改變圖像本身的內容,它可能是選擇了圖像的一部分或者對像素進行了重分布。如果要改變圖像本身的內容,就屬于顏色變換類的數據增強了,常見的包括噪聲、模糊、顏色變換、擦除、填充等等。
二、無監督的數據增強方法包括兩類:
(1) 通過模型學習數據的分布,隨機生成與訓練數據集分布一致的圖片,代表方法有GAN。
(2) 通過模型,學習出適合當前任務的數據增強方法,代表方法有Auto Augment。
在目前的深度學習領域,有監督的數據擴增應用較廣,如旋轉、裁剪、變形、縮放、增加噪聲、模糊、顏色變換,但是這些數據擴增技巧并不能改變目標樣本的前景和背景的相對結構,同時也改變不了不同目標樣本數量間的關系。而單純增加少樣本目標的數據樣本,如復制等方法又不能改變目標樣本數據的多樣性,同時還增加了大量無效樣本,白白增加了大量的學習時間。
而利用GAN網絡等的無監督的數據增強方法可以極大的增加少樣本的數據,提高樣本的豐富性,但是缺點也非常明顯:需要訓練一對生成對抗網絡或者其他的學習模型,而生成對抗網絡或其他的學習模型本身需要大量樣本的訓練,這直接增加了算法的難度,使得算法難以實現。
發明內容
本發明為了解決上述問題,提供一種針對目標檢測的少樣本數據擴增方法,包括以下步驟:
S1,定性分析目標樣本可能出現的場景以及場景的風格;
S2,提取目標樣本的場景特征、風格特征;
S3,利用機器學習算法對場景特征和風格特征進行聚類分析;
S4,根據聚類分析結果從開源數據集中搜索具有相似場景或風格的圖片;
S5,將目標樣本與從開源數據集中找出的相似圖片進行融合,制作出假樣本。
進一步的,針對目標檢測的少樣本數據擴增方法它還包括S6,利用高斯濾波對假樣本進行濾波,一定程度上消除圖片融合過程中出現的邊緣特征。
進一步的,所述S2中,利用場景檢測算法和風格提取算法提取目標樣本的場景特征、風格特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于德魯動力科技(成都)有限公司,未經德魯動力科技(成都)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110070610.9/2.html,轉載請聲明來源鉆瓜專利網。





