[發(fā)明專利]一種前后景分離的熊貓照片卡通化方法有效
| 申請?zhí)枺?/td> | 202011318378.8 | 申請日: | 2020-11-23 |
| 公開(公告)號: | CN112508991B | 公開(公告)日: | 2022-05-10 |
| 發(fā)明(設計)人: | 周祺鈺;向城成;劉啟和;程紅蓉;周世杰 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06T7/194 | 分類號: | G06T7/194;G06T7/13;G06T5/00;G06T5/30;G06V10/44;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都九鼎天元知識產(chǎn)權代理有限公司 51214 | 代理人: | 徐靜 |
| 地址: | 611731 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 后景 分離 熊貓 照片 卡通 方法 | ||
1.一種前后景分離的熊貓照片卡通化方法,其特征在于,包括如下步驟:
步驟1,獲取熊貓照片數(shù)據(jù)集和卡通圖像數(shù)據(jù)集;
步驟2,對所述熊貓照片數(shù)據(jù)集和卡通圖像數(shù)據(jù)集進行圖像預處理:
步驟2.1,對所述熊貓照片數(shù)據(jù)集進行圖像分割得到前景掩膜矩陣和后景掩膜矩陣;
步驟2.2,將所述熊貓照片數(shù)據(jù)集分別與前景掩膜矩陣和后景掩膜矩陣做與運算得到前景圖像集和后景圖像集;
步驟2.3,對所述前景圖像集進行邊緣增強得到邊緣增強的前景圖像集;
步驟2.4,對所述卡通圖像數(shù)據(jù)集進行邊緣模糊得到邊緣模糊的卡通圖像數(shù)據(jù)集;
步驟3,構(gòu)建熊貓卡通圖像生成模型;所述熊貓卡通圖像生成模型包括生成器和判別器,所述生成器包括前景生成分支、后景生成分支和前后景合成分支;
步驟4,定義所述生成器的損失函數(shù):
步驟4.1,定義前景生成分支的內(nèi)容損失函數(shù)Lcon_fg(Gfg,D),計算公式如下:
其中,l指特定VGG層的特征映射,表示邊緣增強的前景圖像集Q,qr表示邊緣增強的前景圖像集Q中的第r個前景圖像,N1表示前景圖像集中的前景圖像數(shù)量,Gfg(qr)表示qr經(jīng)前景生成分支后的輸出圖像,VGGl(Gfg(qr))表示Gfg(qr)經(jīng)VGG網(wǎng)絡輸出的前景特征圖,VGGl(qr)表示qr經(jīng)VGG網(wǎng)絡輸出的前景特征圖;
步驟4.2,定義后景生成分支的內(nèi)容損失函數(shù)Lcon_bg(Gbg,D),計算公式如下:
其中,表示原始的熊貓照片數(shù)據(jù)集P,pk表示原始的熊貓照片數(shù)據(jù)集中的第k個熊貓照片,N2表示熊貓照片數(shù)據(jù)集P中的熊貓照片數(shù)量;Gbg(pk)表示pk經(jīng)后景生成分支后的輸出圖像,VGGl(Gbg(pk))表示Gbg(pk)經(jīng)VGG網(wǎng)絡輸出的后景特征圖,VGGl(pk)表示pk經(jīng)VGG網(wǎng)絡輸出的后景特征圖;
步驟4.3,定義對抗損失函數(shù)Ladv(Gfu,D),計算公式如下:
其中,表示原始的卡通圖像數(shù)據(jù)集C,ci表示原始的卡通圖像數(shù)據(jù)集中的第i個卡通圖像,M1表示卡通圖像數(shù)據(jù)集C中的卡通圖像數(shù)量;表示邊緣模糊的卡通圖像數(shù)據(jù)集E,ej表示邊緣模糊的卡通圖像數(shù)據(jù)集中的第i個卡通圖像,M2表示邊緣模糊的卡通圖像數(shù)據(jù)集E中的卡通圖像數(shù)量;表示前后景聚合特征;
步驟4.4,定義風格損失函數(shù)Lstyle(Gfu,D),計算公式如下:
步驟4.5,所述生成器總損失函數(shù)為L(G,D),計算公式如下:
L(G,D)=ω1Lcon_fg(Gfg,D)+ω2Lcon_bg(Gbg,D)+Ladv(Gfu,D)+Lstyle(Gfu,D)
其中,ω1、ω2表示平衡前景生成分支和后景生成分支損失的權重;
步驟5,利用定義的損失函數(shù)訓練所述熊貓卡通圖像生成模型:
步驟5.1,將所述前景圖像集輸入所述前景生成分支,輸出前景圖像特征;
步驟5.2,將所述后景圖像集輸入所述后景生成分支,輸出后景圖像特征;
步驟5.3,將前景圖像特征和后景圖像特征輸入所述前后景合成分支,輸出前后景聚合特征;
步驟5.4,將所述前后景聚合特征,以及卡通圖像數(shù)據(jù)集和邊緣模糊的卡通圖像數(shù)據(jù)集輸入判別器,將所述判別器的輸出反作用于所述前景生成分支、后景生成分支和前后景合成分支,再利用損失函數(shù)進行對抗訓練,當損失函數(shù)趨于穩(wěn)定時結(jié)束訓練,得到訓練好的熊貓卡通圖像生成模型;
步驟6,將待卡通化的熊貓照片輸入所述訓練好的熊貓卡通圖像生成模型,得到卡通化后的熊貓照片。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經(jīng)電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011318378.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





