[發(fā)明專利]圖像生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010690642.4 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111815506A | 公開(公告)日: | 2020-10-23 |
| 發(fā)明(設(shè)計(jì))人: | 許允杰 | 申請(專利權(quán))人: | 上海眼控科技股份有限公司 |
| 主分類號: | G06T3/00 | 分類號: | G06T3/00;G06K9/62 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 李鵬 |
| 地址: | 200030 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 生成 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種圖像生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。所述方法包括:通過圖像生成模型提取輸入源圖像的輸入圖像特征;利用所述圖像生成模型根據(jù)所述輸入圖像特征和隨機(jī)噪聲參數(shù)得到生成圖像;其中,所述圖像生成模型為令生成損失函數(shù)最大訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型,所述生成損失函數(shù)為所述生成圖像的圖像內(nèi)容差異值與圖像風(fēng)格差異值之和。采用本方法能夠使得生成圖像之間的差異大,提高了生成圖像之間的多樣性。
技術(shù)領(lǐng)域
本申請涉及圖像處理技術(shù)領(lǐng)域,特別是涉及一種圖像生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著圖像處理技術(shù)的發(fā)展,出現(xiàn)了通過神經(jīng)網(wǎng)絡(luò)基于輸入的圖像生成新的圖像的技術(shù),該技術(shù)越來越多的被應(yīng)用于人們的日常生活中,如對人們的裝扮樣貌進(jìn)行易容變裝,對夫妻后代容貌的預(yù)測等等。
傳統(tǒng)技術(shù)中,圖像生成輸入兩張圖像,一張作為源圖像另外一張作為參考圖像,兩張圖像通過不同的編碼器(Encoder)后,將編碼器編碼得到的特征融合經(jīng)過反卷積網(wǎng)絡(luò),生成和參考圖像相同類別的圖像。
然而,傳統(tǒng)技術(shù)的生成圖像之間視覺差異小,生成的圖像模式單一,只有一種或幾種特定的模式,圖像生成不具有多樣性。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種圖像生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
一種圖像生成方法,所述方法包括:
通過圖像生成模型提取輸入源圖像的輸入圖像特征;
利用所述圖像生成模型根據(jù)所述輸入圖像特征和隨機(jī)噪聲參數(shù)得到生成圖像;其中,所述圖像生成模型包括令生成損失函數(shù)最大訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型,所述生成損失函數(shù)為所述生成圖像間的圖像內(nèi)容差異值與圖像風(fēng)格差異值之和。
在其中一個(gè)實(shí)施例中,所述圖像生成模型包括判別子模型和生成子模型,在所述利用圖像生成模型根據(jù)所述輸入圖像特征和隨機(jī)噪聲參數(shù)得到生成圖像之前,包括:
通過初始生成子模型得到訓(xùn)練源圖像的至少兩訓(xùn)練生成圖像;
根據(jù)所述訓(xùn)練生成圖像和目標(biāo)圖像對初始判別子模型和初始生成子模型進(jìn)行訓(xùn)練,得到所述判別子模型和所述生成子模型;其中,所述初始判別子模型用于根據(jù)輸入圖像為真圖像的真圖概率判斷所述輸入圖像是否為真圖像;所述目標(biāo)圖像為與所述生成圖像相同類型的圖像。
在其中一個(gè)實(shí)施例中,根據(jù)所述訓(xùn)練生成圖像和目標(biāo)圖像對初始判別子模型和初始生成子模型進(jìn)行訓(xùn)練,得到所述判別子模型和所述生成子模型,包括:
根據(jù)概率差值對所述初始判別子模型進(jìn)行訓(xùn)練,得到中間判別子模型;其中,所述概率差值根據(jù)所述訓(xùn)練生成圖像為真圖像的生成概率與目標(biāo)圖像為真圖像的目標(biāo)概率得到;
根據(jù)所述生成損失函數(shù)和所述生成概率對所述初始生成子模型進(jìn)行訓(xùn)練,得到中間生成子模型;
當(dāng)所述概率差值小于預(yù)設(shè)差值、所述生成損失函數(shù)大于預(yù)設(shè)損失值且生成概率差大于預(yù)設(shè)概率差時(shí),將所述中間判別子模型作為所述判別子模型,將所述中間生成子模型作為所述生成子模型;其中,所述生成概率差根據(jù)所述生成概率與假圖標(biāo)準(zhǔn)概率之差得到。
在其中一個(gè)實(shí)施例中,所述根據(jù)概率差值對所述初始判別子模型進(jìn)行訓(xùn)練,得到中間判別子模型,包括:
將所述訓(xùn)練生成圖像和所述目標(biāo)圖像輸入所述初始判別子模型,得到所述生成概率和所述目標(biāo)概率;
獲取所述生成概率與假圖標(biāo)準(zhǔn)概率之差的平均值,作為生成概率差;
獲取所述目標(biāo)概率與真圖標(biāo)準(zhǔn)概率之差的平均值,作為目標(biāo)概率差;
獲取所述生成概率差與所述目標(biāo)概率差的概率差平均值,得到所述概率差值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海眼控科技股份有限公司,未經(jīng)上海眼控科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010690642.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





