[發明專利]一種基于生成對抗網絡的圖像多樣性增強方法與系統有效
| 申請號: | 202111561049.0 | 申請日: | 2021-12-20 |
| 公開(公告)號: | CN113947706B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 唐彰國;張健;李煥洲;王涵 | 申請(專利權)人: | 四川師范大學 |
| 主分類號: | G06V10/82 | 分類號: | G06V10/82;G06V10/762;G06V10/774;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 成都為知盾專利代理事務所(特殊普通合伙) 51267 | 代理人: | 李漢強 |
| 地址: | 610000 *** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 網絡 圖像 多樣性 增強 方法 系統 | ||
1.一種基于生成對抗網絡的圖像多樣性增強方法,應用于裝有Tensorflow框架的Windows系統設備,其特征在于,包括:
S1:搭建一個生成對抗網絡模型,包括聚類模塊、具有分類導向的損失函數、判別器模塊和生成器模塊;
S2:將采集的圖像數據形成原始圖像數據集,并對所述原始圖像數據集做歸一化預處理,并定義優化器和損失函數;
所述S2定義的損失函數為編碼長度函數和辛普森多樣性指數相結合,具體為:
S2.1:定義圖像的編碼長度函數公式為:
其中,m和D分別為數據的尺寸,對應為圖片的長與寬,I為上層網絡殘差,X為圖像張量本身,同理
S2.2:定義辛普森多樣性指數公式為:
其中
當一個群落中,每個種群的數量相同時,得到辛普森多樣性指數的另一種形式,其公式為:
其中,S代表,這個群落中的物種的種類數;
S2.3:將辛普森多樣性指數和編碼長度函數相結合,得到具有分類導向的損失函數,損失函數公式為:
其中,α是一個閾值,取值范圍為(0,1),Ld-loss代表的是判別器損失值,Lg-loss是生成器損失值,E代表期望,x~Ptag代表的是x是tag集合中的數據,SPI是辛普森多樣性指數,λ是一個范圍為(0,1)的閾值,L(x,ε)代表的是編碼長度函數;
S3:使用Tensorflow框架的函數生成噪聲,將生成的噪聲放入生成器模塊,生成對應的圖像對抗樣本;
S4:所述圖像對抗樣本進入聚類模塊,然后聚類模塊對所述圖像對抗樣本進行聚類,并得出聚類數值;
S5:所述原始圖像數據集和所述圖像對抗樣本進入判別器模塊,判別器模塊根據所述原始圖像數據集對所述圖像對抗樣本進行判斷,輸出一個判斷結果;
S6:根據判斷結果,基于所述聚類數值,利用S2定義的損失函數,計算所述生成器模塊的損失值和所述判別器模塊的損失值,并通過反向傳播的訓練方式來提升生成器模塊和判別器模塊的性能,并獲取判別器模塊的生成圖像作為圖像多樣性增強樣本;
S7:然后循環S3-S6,直到生成器模塊和判別器模塊的訓練次數達到預設的訓練閾值,循環結束,生成最終的圖像多樣性增強數據集。
2.根據權利要求1所述的一種基于生成對抗網絡的圖像多樣性增強方法,其特征在于,所述S1搭建判別器模塊和生成器模塊具體為:
S1.1:搭建一個八層神經網絡結構的判別器模塊:利用Keras框架中的Conv2D函數搭建四層卷積神經網絡,然后使用BatchNormalization函數搭建兩層BN層,以及最后的一個Flatten層和一個全連接層;
S1.2:搭建一個七層神經網絡結構的生成器模塊:首先搭建一個作為噪聲輸入大小為N×N的全連接層,再利用Keras框架中的Conv2DTranspose函數搭建四層反卷積神經網絡層,然后使用BatchNormalization函數搭建兩層BN層,最后一層反卷積神經網絡層作為生成器模塊的輸出。
3.根據權利要求2所述的一種基于生成對抗網絡的圖像多樣性增強方法,其特征在于,S3具體為:
S3.1:生成一個范圍在[0-1]之間且大小為N×N的噪聲,輸入到生成器模塊的全連接層中;
S3.2:生成器模塊將輸入的N×N噪聲,進行一個重組操作,將其維度從二維張量改變為三維張量,然后進行反卷積操作;
S3.3:最后一層反卷積神經網絡層輸出生成的對抗樣本圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川師范大學,未經四川師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111561049.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于時空特征的關系收斂方法、裝置、設備及存儲介質
- 下一篇:一種混合器





