[發(fā)明專利]一種語義結(jié)構(gòu)一致的圖像內(nèi)容轉(zhuǎn)換方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010979163.4 | 申請(qǐng)日: | 2020-09-17 |
| 公開(公告)號(hào): | CN112149802B | 公開(公告)日: | 2022-08-09 |
| 發(fā)明(設(shè)計(jì))人: | 尹夢(mèng)曉;林振峰;覃子軒;楊鋒 | 申請(qǐng)(專利權(quán))人: | 廣西大學(xué) |
| 主分類號(hào): | G06N3/04 | 分類號(hào): | G06N3/04;G06N3/08;G06V10/80;G06V10/82 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 530004 廣西*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語義 結(jié)構(gòu) 一致 圖像 內(nèi)容 轉(zhuǎn)換 方法 | ||
1.一種語義結(jié)構(gòu)一致的圖像內(nèi)容轉(zhuǎn)換方法,其特征在于,包括以下步驟:
1)收集訓(xùn)練數(shù)據(jù),所述訓(xùn)練數(shù)據(jù)是指成對(duì)的圖像,包括源圖像和目標(biāo)圖像,源圖像和目標(biāo)圖像一一對(duì)應(yīng),語義結(jié)構(gòu)上保持一致;
2)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)建轉(zhuǎn)換模型,包括編碼器和生成器;
3)使用編碼器下采樣經(jīng)過預(yù)處理的源圖像,獲取潛在編碼;
4)使用生成器上采樣潛在編碼,上采樣過程中通過動(dòng)態(tài)感受野自適應(yīng)融合多尺度信息,生成虛假的目標(biāo)圖像;其中,所述生成器包含上采樣網(wǎng)絡(luò)層、特征處理模塊和輸出層,所述生成器將編碼器輸出的潛在編碼上采樣,并在上采樣過程中通過動(dòng)態(tài)感受野自適應(yīng)融合多尺度信息,處理方式為:
式中,表示編碼器輸出的潛在編碼,表示生成器中第i層上采樣網(wǎng)絡(luò)層輸出的特征,表示生成器中第i-1層上采樣網(wǎng)絡(luò)層輸出的特征,表示編碼器中第(n-i+1)層上采樣網(wǎng)絡(luò)層輸出的特征,⊙表示沿張量的維度進(jìn)行拼接,表示生成器中第i層上采樣網(wǎng)絡(luò)層使用的轉(zhuǎn)置卷積,表示生成器中第i層上采樣網(wǎng)絡(luò)層使用的歸一化方式,表示生成器中第i層上采樣網(wǎng)絡(luò)層使用的激活函數(shù),i∈{1,2,3,...,n},n表示生成器中總的上采樣網(wǎng)絡(luò)層數(shù),m表示編碼器中總的下采樣網(wǎng)絡(luò)層數(shù),dG表示生成器中的特征處理模塊,表示編碼器中輸入層輸出的特征,表示生成器中輸出層使用的轉(zhuǎn)置卷積,表示生成器中輸出層使用的激活函數(shù),IF表示虛假的目標(biāo)圖像;其中,dG對(duì)特征的處理方式為:
式中,表示生成器的上采樣網(wǎng)絡(luò)層中dG輸入的特征,sd表示通過動(dòng)態(tài)感受野自適應(yīng)融合多尺度信息的模塊,sd在dG中提取和融合多尺度信息,表示dG中第j次特征處理使用的歸一化方式,表示dG中第j次特征處理使用的激活函數(shù),表示dG中第j次特征處理使用的卷積,表示dG中第j次特征處理輸出的特征,表示dG中第j-1次特征處理輸出的特征,j∈{1,2},表示dG中的殘差連接使用的激活函數(shù),表示dG輸出的特征;其中,sd通過動(dòng)態(tài)感受野自適應(yīng)融合多尺度信息的方式包含以下步驟:
4.1)使用不同感受野的卷積獲取多尺度信息:
式中,表示sd輸入的特征,表示sd中第k個(gè)卷積分支使用感受野大小為c的卷積,表示sd中第k個(gè)卷積分支使用的歸一化方式,表示sd中第k個(gè)卷積分支使用的激活函數(shù),表示sd中第k個(gè)卷積分支輸出的特征,包含在感受野大小為c的卷積上獲取的尺度信息,p表示sd中的卷積分支的數(shù)量,k∈{1,2,3,...,p},q表示sd中卷積分支中感受野的大小,c∈{1,3,5,...,q};
4.2)使用全局平均池化統(tǒng)計(jì)p個(gè)卷積分支輸出特征的全局變化:
式中,GAP表示全局平均池化,表示sd中第p個(gè)卷積分支以感受野大小為q的卷積獲取的特征,Ws表示全局變化的張量;
4.3)使用Ws計(jì)算自適應(yīng)選擇權(quán)重:
式中,ns表示對(duì)Ws進(jìn)行降維使用的歸一化方式,fs表示對(duì)Ws進(jìn)行降維使用的激活函數(shù),表示計(jì)算sd中第k個(gè)卷積分支的選擇權(quán)重時(shí)使用的卷積,fw表示計(jì)算選擇權(quán)重使用的激活函數(shù),表示sd中第k個(gè)卷積分支的選擇權(quán)重,表示不同尺度信息融合的特征,表示sd中第p個(gè)卷積分支的選擇權(quán)重,通過控制中尺度信息的轉(zhuǎn)換程度,使sd獲得動(dòng)態(tài)感受野;
5)構(gòu)建判別器,使用虛假的目標(biāo)圖像,經(jīng)過預(yù)處理的源圖像和經(jīng)過預(yù)處理的目標(biāo)圖像通過判別器構(gòu)建損失函數(shù);
6)通過訓(xùn)練使損失函數(shù)收斂獲取參數(shù)最優(yōu)的轉(zhuǎn)換模型,使用參數(shù)最優(yōu)的轉(zhuǎn)換模型能夠轉(zhuǎn)換與訓(xùn)練數(shù)據(jù)中源圖像同類的圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣西大學(xué),未經(jīng)廣西大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010979163.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語義表征和語義計(jì)算的信號(hào)語義識(shí)別方法
- 語義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





