[發(fā)明專利]一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法有效
| 申請?zhí)枺?/td> | 202010024870.8 | 申請日: | 2020-01-10 |
| 公開(公告)號(hào): | CN111243045B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計(jì))人: | 郭春生;周家洛;應(yīng)娜;陳華華;楊萌 | 申請(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號(hào): | G06T9/00 | 分類號(hào): | G06T9/00 |
| 代理公司: | 浙江千克知識(shí)產(chǎn)權(quán)代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 混合 模型 先驗(yàn) 編碼器 圖像 生成 方法 | ||
1.一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,包括步驟:
S1.預(yù)設(shè)生成圖像訓(xùn)練數(shù)據(jù)集;其中,所述訓(xùn)練數(shù)據(jù)集由若干批次的訓(xùn)練數(shù)據(jù)組成;
S2.搭建基于高斯混合模型先驗(yàn)的變分自編碼器網(wǎng)絡(luò);
S3.將所述預(yù)設(shè)的若干批次的訓(xùn)練數(shù)據(jù)上傳至搭建的變分自編碼器網(wǎng)絡(luò)中,并確定所述變分自編碼器網(wǎng)絡(luò)的后驗(yàn)分布和先驗(yàn)分布;
S4.確定所述高斯混合模型中高斯分量之間的關(guān)系,得到映射函數(shù);
S5.利用所述變分自編碼器網(wǎng)絡(luò)和得到的映射函數(shù)得到重構(gòu)損失函數(shù)和KL散度函數(shù),根據(jù)所述得到的重構(gòu)損失函數(shù)和KL散度函數(shù)計(jì)算所述變分自編碼器網(wǎng)絡(luò)的后驗(yàn)分布和先驗(yàn)分布的損失函數(shù),并對所述變分自編碼器網(wǎng)絡(luò)的參數(shù)進(jìn)行更新以生成圖像;
S6.當(dāng)生成圖像時(shí),將偽輸入作為輸入圖像上傳至所述變分自編碼器網(wǎng)絡(luò),得到最終生成的圖片。
2.根據(jù)權(quán)利要求1所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S2還包括構(gòu)建變分自編碼器網(wǎng)絡(luò)中隱變量的后驗(yàn)分布。
3.根據(jù)權(quán)利要求2所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S2中搭建的變分自編碼器網(wǎng)絡(luò)中的參數(shù)包括網(wǎng)絡(luò)輸入圖像尺寸C×H×W、批次大小B,隱變量維數(shù)D,隱變量z,高斯混合數(shù)量M,偽輸入α,偽輸入數(shù)量K。
4.根據(jù)權(quán)利要求3所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S3中將所述預(yù)設(shè)的若干批次的訓(xùn)練數(shù)據(jù)上傳至搭建的變分自編碼器網(wǎng)絡(luò)中,其中上傳的訓(xùn)練數(shù)據(jù)包括圖像樣本X={x1,x2,…,xN},其中,xi為當(dāng)前批次中第i個(gè)樣本,i=1,2,…B、偽輸入α={α1,α2,...,αK},其中αj表示第j個(gè)偽輸入,j=1,2,…K。
5.根據(jù)權(quán)利要求4所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S3確定的是隱變量的后驗(yàn)分布以及聚合后驗(yàn)形式的隱變量先驗(yàn)分布;
所述隱變量后驗(yàn)分布為:
所述隱變量先驗(yàn)為:
其中,M表示高斯混合數(shù)量,K表示偽輸入的數(shù)量,αk表示偽輸入,πm表示高斯混合模型的系數(shù)。
6.根據(jù)權(quán)利要求5所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S4中確定所述高斯混合模型中高斯分量之間的關(guān)系是通過貪心算法確定的。
7.根據(jù)權(quán)利要求6所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S4具體為根據(jù)以下函數(shù)依次構(gòu)造映射函數(shù):
其中,A={β(t)|t=1,...,m-1};β(·)表示映射函數(shù)。
8.根據(jù)權(quán)利要求7所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S5中得到的重構(gòu)損失函數(shù)為:
其中,n表示輸入圖片的維度;xi表示輸入樣本圖片第i維度的值;表示輸出圖片第i維度的值;LRE表示每個(gè)樣本的重構(gòu)損失。
9.根據(jù)權(quán)利要求8所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述步驟S5中得到的KL散度函數(shù)為:
其中,LKL表示每個(gè)樣本的KL距離。
10.根據(jù)權(quán)利要求9所述的一種基于高斯混合模型先驗(yàn)變分自編碼器的圖像生成方法,其特征在于,所述計(jì)算得到的損失函數(shù)為:
其中,表示第i個(gè)樣本的重構(gòu)誤差;表示第i個(gè)樣本的KL散度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010024870.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





