[發(fā)明專利]基于生成對抗網(wǎng)絡(luò)的去除手勢圖像背景的方法在審
| 申請?zhí)枺?/td> | 202010984112.0 | 申請日: | 2020-09-10 |
| 公開(公告)號: | CN112215868A | 公開(公告)日: | 2021-01-12 |
| 發(fā)明(設(shè)計)人: | 王慶飛;王長波;姜燕 | 申請(專利權(quán))人: | 湖北醫(yī)藥學(xué)院 |
| 主分類號: | G06T7/194 | 分類號: | G06T7/194;G06N3/08;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 442000 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 生成 對抗 網(wǎng)絡(luò) 去除 手勢 圖像 背景 方法 | ||
基于生成對抗網(wǎng)絡(luò)的去除手勢圖像背景的方法,包括如下幾個步驟:步驟一:模型建立:包括建立生成對抗網(wǎng)絡(luò)模型、定義關(guān)于模型目標(biāo)函數(shù)、引入批量歸一化層、引入線性整流函數(shù)激活函數(shù)和引入Dropout層;步驟二:模型訓(xùn)練,步驟三:模型使用,包括預(yù)處理、歸一化和調(diào)用模型,最終得到的輸出即為不帶背景的手勢圖像。本發(fā)明具有高效、準(zhǔn)確、快速、易部署等特點。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別涉及基于生成對抗網(wǎng)絡(luò)的去除手勢圖像背景的方法。
背景技術(shù)
對含有手勢的圖像進行背景移除任務(wù)時,當(dāng)前主流方法是圖像語義分割。然而目前該方法存在的一個問題是效率低,難以處理精細化的圖像背景移除任務(wù)。
2014年FCN(Fully Convolutional Networks for Semantic Segmentation)開啟了圖像分割的新篇章,在原來簡單的VGG,AlexNet神經(jīng)網(wǎng)絡(luò)方法上采用了上采樣,采用跳躍連接,可以實現(xiàn)對圖像語義的分割。后續(xù)研究者主要的工作是對網(wǎng)絡(luò)的更改,對一些特定任務(wù)引入注意力機制。但是這些工作也存在一些問題:例如,丟失邊緣信息、粒度不夠精細等,如圖1所示。為實現(xiàn)更為精細化的摳圖任務(wù),同時不丟失重要的邊緣信息,則需要依賴更為復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)和更大的訓(xùn)練開銷。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有方法的不足,本發(fā)明的目的在于提供基于生成對抗網(wǎng)絡(luò)的去除手勢圖像背景的方法,具有高效、準(zhǔn)確、快速、易部署等特點。為實現(xiàn)上述目的,本發(fā)明采取以下技術(shù)方案:基于生成對抗網(wǎng)絡(luò)的去除手勢圖像背景的方法,其主要包括如下幾個步驟:
步驟一:模型建立
步驟1.1建立生成對抗網(wǎng)絡(luò)模型,條件GAN網(wǎng)絡(luò)包括兩個模塊,分別為生成器G和判別器D,其中生成器G訓(xùn)練的目標(biāo)是讓生成圖像以假亂真,判別器D訓(xùn)練目標(biāo)是檢測生成器G生成的假圖像;
步驟1.2定義關(guān)于模型目標(biāo)函數(shù),損失函數(shù)是決定模型訓(xùn)練優(yōu)化的目標(biāo)的數(shù)學(xué)方法,在生成對抗網(wǎng)絡(luò)中,隨機噪聲向量z到輸出圖片y的映射關(guān)系,即G:z→y,條件生成對抗網(wǎng)絡(luò)將輸入圖像x和隨機噪聲向量z到輸出圖像y的映射關(guān)系,即CG:(x,z)→y;
生成對抗網(wǎng)絡(luò)的目標(biāo)函數(shù)如式:
該式中,x是帶背景圖片,y是生成器G生成的圖片,z是引入的隨機噪聲圖片向量;
需要通過訓(xùn)練,讓生成器G使得這個目標(biāo)函數(shù)盡可能小,而判別器D想盡可能使得這個目標(biāo)函數(shù)大,即訓(xùn)練優(yōu)化的方式為式:
其中,LcGAN(G,D)是生成對抗網(wǎng)絡(luò)的目標(biāo)函數(shù),上述已經(jīng)說明,其中是對判別器做最大值優(yōu)化,是對生成器做最小值優(yōu)化,當(dāng)取到最小值時取得模型的參數(shù);
然而生成器G的任務(wù)不僅是欺騙鑒別器,而且還要使它接近真正意義上的無背景真實輸出,所以修正后的目標(biāo)函數(shù)為式
其中Lz1(G)=Ex,y,z[||y-G(x,z)||1],目標(biāo)是為了讓生成器的輸出接近真正意義上的無背景的真實輸出,而λ是一介于0-1之間的系數(shù),用于平衡圖像的質(zhì)量;
步驟1.3引入批量歸一化層:
模型中需要使用到批量歸一化(Batch normalization,BN)層,其中,BN層的操作主要是對卷積層的輸出進行標(biāo)準(zhǔn)化,計算形式如式(5)所示:
其中μB處理如式(6)所示,σB的計算處理如式(7)所示,是為了防止分母為0而引入的無窮小值,xi是當(dāng)前層的輸入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖北醫(yī)藥學(xué)院,未經(jīng)湖北醫(yī)藥學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010984112.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動生成方法、裝置、存儲介質(zhì)和計算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





