[發明專利]基于深度學習的樣本圖像生成方法及其系統在審
| 申請號: | 202110162777.8 | 申請日: | 2021-02-05 |
| 公開(公告)號: | CN112836755A | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 范小龍;葉錦;喬宇 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳智趣知識產權代理事務所(普通合伙) 44486 | 代理人: | 王策 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 樣本 圖像 生成 方法 及其 系統 | ||
本發明提供了基于深度學習的樣本圖像生成方法及其系統,方法包括:獲取原始圖像集合,原始圖像集合包含多個類別的圖像;對原始圖像集合進行主題類別計算,獲取各個類別的主題圖像集合;對主題圖像集合進行預處理;根據預處理后的主題圖像集合構建各個類別的圖像生成模型;對各個類別的圖像生成模型進行聯合訓練學習,獲取各個類別的生成圖像集合;對生成圖像集合進行圖像校驗。本發明針對現有的圖像生成技術中,生成圖像的精度無法滿足實際需求的缺陷,提出了基于深度學習的樣本圖像生成方法及其系統,基于深度學習網絡對圖像進行自動化生成,能有效提高生成圖像的精度,同時兼顧了生成圖像的多樣性和穩定性,具有較高的實用價值。
技術領域
本發明涉及圖像處理領域,具體而言,涉及基于深度學習的樣本圖像生成方法及其系統。
背景技術
傳統的圖像生成方法,通常采用旋轉、剪切、加噪音、顏色變化等方法對圖像進行簡單的處理,只是對圖像做了簡單的增強變換,并不能對圖像細節,例如圖像紋理、細節輪廓等做精細化的變換,也很難直接多風格多樣式的擴充原始圖像。
基于MUNIT的圖像生成方法采用了內容和樣式兩種編碼器,來對圖像的樣式和風格分別編碼學習,可以進行同類別圖像間的樣式的轉換學習,真正實現圖像之間多模態風格的轉換。但是該方法只能應用于相似品類圖像的學習,如果直接應用于跨品類的圖像生成,生成圖像的也會出現多種干擾模糊等低質情況。
基于深度學習的CycleGAN圖像生成方法由兩個經過對抗損失和循環重構損失訓練的殘差轉換網絡組成。但該方法很難直接生成更多模態多樣式的圖像樣本,即使對輸入圖像加入更多干擾也不能直接產生更多模態的圖像內容。
因此,目前的深度學習圖像生成或圖像翻譯技術,由于其方法本身存在相似類別的多模態轉換限制,如果直接采用全類別的圖像直接進行生成,所生成的圖像精度,無法直接滿足實際生成任務的精度需求。此外,傳統的圖像生成方法的樣式單一,無法滿足生成圖像對風格樣式的需求。
發明內容
基于現有技術存在的問題,本發明提供了一種基于深度學習的樣本圖像生成方法及其系統。具體方案如下:
一種基于深度學習的樣本圖像生成方法,包括如下步驟:
圖像獲取:獲取原始圖像集合,所述原始圖像集合包含多個類別的圖像;
圖像分類:對所述原始圖像集合進行主題類別計算,獲取各個類別的主題圖像集合;
模型構建:基于所述主題圖像集合構建各個類別的圖像生成模型;;
圖像生成:對各個類別的所述圖像生成模型進行聯合訓練學習,獲取各個類別的生成圖像集合。
在一個具體的實施例中,所述圖像分類具體包括:
在所述原始圖像集合中選取預設比例的圖像進行標注獲取第一標簽圖像,根據所述第一標簽圖像構建品類圖像集合,結合深度卷積模型構建初始分類模型;
通過所述初始分類模型對所述原始圖像集合中除所述第一標簽圖像以外的圖像進行分類,將分類結果正確的圖像作為第二標簽圖像,并將所述第二標簽圖像劃分到所述品類圖像集合;
根據所述品類圖像集合對所述初始分類模型進行迭代訓練,直至滿足迭代停止條件,將迭代停止后的初始分類模型作為第一分類模型;
通過所述第一分類模型對所述原始圖像集合進行分類,獲取各個類別的主題圖像集合,通過計算圖像之間的相似度獲取各個類別的相似圖像閾值。通過構建分類模型,可以高效準確的對圖像進行分類,分類效果好。
在一個具體的實施例中,所述圖像生成具體包括:
每個類別的所述圖像生成模型根據所述相似圖像閾值,選擇其它類別的所述主題圖像集合進行聯合訓練學習;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110162777.8/2.html,轉載請聲明來源鉆瓜專利網。





