[發明專利]一種擴充目標識別的訓練數據的圖像合成方法有效
| 申請號: | 201810260915.4 | 申請日: | 2018-03-28 |
| 公開(公告)號: | CN108492343B | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 毛克明;張維益;崔培楠;宋杰 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06T11/00 | 分類號: | G06T11/00;G06T7/194;G06K9/62 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 梁焱 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 擴充 目標 識別 訓練 數據 圖像 合成 方法 | ||
本發明提供一種擴充目標識別的訓練數據的圖像合成方法,涉及計算機視覺技術領域。該方法針對特定生產場景中的圖像數據,進行規模和種類統計,采用K?Means聚類區分前景圖像與底圖,將前景與底圖以及帶有標記的特定場景數據集進行合成,用合成數據來擴充圖像數據集。本發明的方法能夠自動爬取相關素材圖片并將所需素材提取并合成到指定的用戶特定場景下,從而在短時間、低成本下獲得一定規模的合成數據集達到擴充數據集從而提高其魯棒性,為增強深度學習模型識別能力提供輔助。
技術領域
本發明涉及計算機視覺技術領域,尤其涉及一種擴充目標識別的訓練數據的圖像合成方法。
背景技術
近年來,隨著硬件計算能力的不斷發展以及高性能的GPU不斷升級,人工智能技術的前景又變得明朗起來。其中,尤其以深度學習的計算機視覺領域受此次改變而獲益良多。像人臉識別、圖像識別、圖像分類、人臉檢測、圖像分割等基本的圖像處理算法都隸屬于計算機視覺領域的技術。另一方面,隨著信息時代的快速發展,海量數據的產生也為深度學習的飛速前進奠定基礎。影響深度學習模型效果好壞的最重要的一個因素便是數據。海量的數據代表著模型的強泛化能力,相反,少量的數據會使得模型面臨過擬合或者欠擬合的常見問題。使得模型在實際應用場景的表現差強人意。
然而,雖然大數據時代產生了海量的視頻圖片數據,但是隨之而來的是內容的復雜性,多樣性,冗余性。并且遠遠達不到作為深度學習可用的數據集標準,現在流行的主流深度學習框架都是以監督學習為基礎的。這就意味著無論是分類問題還是回歸問題,訓練數據集的數據是需要標注的,在即使是清洗過的海量數據集里仍然沒有標記信息。而這一部分是需要人工來完成。比如比較著名的ImageNet數據庫。面對海量的未標記圖像視頻數據,其數量級一般在數億級別以上,如果全部用人工來完成標記,所耗費的人工成本就是一個天文數字,對于任何一家公司來說都是難以承受的,即使拋開人工成本不算,人工標記所花費的時間成本都是完全超過大多數的科技研發公司開發的迭代周期,而超過項目的生命周期對于任何公司來說意味著虧損,這是無法容忍的。所以目前行業的主要的訓練數據構成是大部分來源于開源數據庫,少部分由人工標注(特定的應用場景除外)。然而開源數據庫的數據的分布與特征往往與特定的應用場景相差甚遠,模型效果自然相差很多。
因此,針對目前深度學習領域的現狀,由于對標注且準確的訓練數據的極度匱乏,急需要一種可以針對指定應用場景的快速擴充合成訓練數據集的方法。
發明內容
本發明要解決的技術問題是針對上述現有技術的不足,提供一種擴充目標識別的訓練數據的圖像合成方法,在短時間內輔助深度學習的各種框架以及算法在缺少特定的訓練數據集時,可以進行數據的快速合成達到大規模的數據擴充,從而提升深度學習的開發效率,并使得訓練得到的模型在特定的應用場景具有更好的泛化性和魯棒性,從而為識別技術可以在用戶場景具有一定的實用性奠定基礎。
為解決上述技術問題,本發明所采取的技術方案是:一種擴充目標識別的訓練數據的圖像合成方法,包括以下步驟:
步驟1、根據實際生產場景,進行如下定義:
生產場景:具有在實際環境(背景信息)和所需要識別的物體并帶有標記的圖像的集合;
原始圖像:通過各種方式獲取的帶有生產場景信息的圖像;
圖像尺寸:訓練數據中,圖像的具體尺寸:寬*高);
底圖:含有生產場景的主要背景信息的圖像;
對象:需要檢測并識別的物體;
前景圖像:從原始圖像中分離并提取帶有對象并具有標記的圖像;
合成圖像:含有帶有標記信息的對象的底圖;
根據需求分別確定底圖、圖像尺寸、對象,并獲得原始圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810260915.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:合并碎圖的方法、裝置、處理器、存儲介質和終端
- 下一篇:一種肖像漫畫生成方法





