[發明專利]基于擴散循環生成式對抗網絡的圖像風格遷移方法在審
| 申請號: | 202211470261.0 | 申請日: | 2022-11-23 |
| 公開(公告)號: | CN116433466A | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 萬久地;潘純潔;張前進;常琦;朱焱 | 申請(專利權)人: | 中國鐵塔股份有限公司重慶市分公司 |
| 主分類號: | G06T3/00 | 分類號: | G06T3/00;G06N3/0475 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 401120 重慶*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 擴散 循環 生成 對抗 網絡 圖像 風格 遷移 方法 | ||
本發明涉及一種基于擴散循環生成式對抗網絡的圖像風格遷移方法,屬于圖像處理領域,包括以下步驟:S1:創建風格A圖片數據集和風格B圖片數據集,對圖像數據進行預處理,構建訓練集和測試集;S2:構建擴散循環生成式對抗網絡模型;S3:設計擴散循環生成式對抗網絡模型的損失函數;S4:將風格A與風格B的非成對訓練集輸入所述擴散循環生成式對抗網絡模型中進行訓練;S5:將風格A與風格B的測試集分別輸入訓練好的擴散循環生成式對抗網絡模型中,獲得風格轉換后的圖像,完成風格遷移任務。
技術領域
本發明屬于圖像處理領域,涉及一種基于擴散循環生成式對抗網絡的圖像風格遷移方法。
背景技術
圖像風格遷移,也稱圖像風格轉換,是指將輸入圖像的風格,轉變成指定一幅或多幅圖像風格的方法。算法須保證原圖像結構,只將圖像風格進行轉換,使得最終輸出的合成圖像呈現出與輸入圖像內容和風格的完美結合。循環生成式對抗網絡作為GAN類的經典圖像風格遷移算法,使用兩個鏡像對稱的GAN,使圖片關鍵信息得以保留,無需配對數據即可進行訓練。但是在實踐中,循環生成式對抗網絡使用的GAN模塊會受到各種問題的困擾,從不收斂、訓練不穩定到模式崩潰。
當神經網絡試圖學習大量重復出現的模式時,通常會發生過度擬合。具有零均值的高斯噪聲基本上在所有頻率中具有數據點,可以有效地扭曲高頻特征。添加適量的噪音可以增強鑒別器的學習能力。
發明內容
有鑒于此,本發明的目的在于提供一種擴散循環生成式對抗網絡的圖像風格遷移方法,為了注入適當的實例噪聲來促進GAN的訓練,使用基于擴散的高斯混合分布來對生成器的生成圖像注入實例噪聲以增加鑒別器的輸入樣本。
為達到上述目的,本發明提供如下技術方案:
一種基于擴散循環生成式對抗網絡的圖像風格遷移方法,包括以下步驟:
S1:創建風格A圖片數據集和風格B圖片數據集,對圖像數據進行預處理,構建訓練集和測試集;
S2:構建擴散循環生成式對抗網絡模型;
S3:設計擴散循環生成式對抗網絡模型的損失函數;
S4:將風格A與風格B的非成對訓練集輸入所述擴散循環生成式對抗網絡模型中進行訓練;
S5:將風格A與風格B的測試集分別輸入訓練好的擴散循環生成式對抗網絡模型中,獲得風格轉換后的圖像,完成風格遷移任務。
進一步,步驟S2所述的構建擴散循環生成式對抗網絡模型,具體包括以下步驟:
S21:選取循環生成式對抗網絡中的生成器和鑒別器作為擴散循環生成對抗網絡模型的生成器和鑒別器;
S22、構建擴散模塊,其中主要工作模塊包括前向擴散模塊和擴散強度自適應控制模塊。
S23:設計擴散循環生成式對抗網絡模型的體系結構由兩個生成器、兩個鑒別器、兩個擴散模塊組成;
S24:模型結構分為兩個學習過程:從風格A圖像到風格B圖像的學習過程和從風格B圖像到風格A圖像的學習過程。
進一步,步驟S22中所述的構建擴散模塊,具體包括以下步驟:
S221:設計前向擴散模塊,向真實圖像與生成圖像中注入高斯實例噪聲以平滑圖像數據分布,注入噪聲的強度由擴散步長t控制,得到的噪聲數據混合分布由y表示;
S222:將得到的真實圖像與生成圖像的噪聲混合分布按照擴散強度t輸入鑒別器中判斷生成圖像真假;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國鐵塔股份有限公司重慶市分公司,未經中國鐵塔股份有限公司重慶市分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211470261.0/2.html,轉載請聲明來源鉆瓜專利網。





