[發明專利]基于生成對抗網絡的電子鼻數據校正方法在審
| 申請號: | 202210138121.7 | 申請日: | 2022-02-15 |
| 公開(公告)號: | CN114511031A | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 劉然;陳希;毛虎;田逢春;錢君輝;崔珊珊;王斐斐;陳丹;陳鑫;任席偉;王仕丹 | 申請(專利權)人: | 重慶大學;勒威半導體技術(嘉興)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重慶信航知識產權代理有限公司 50218 | 代理人: | 吳彬 |
| 地址: | 400030 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生成 對抗 網絡 電子 數據 校正 方法 | ||
1.基于生成對抗網絡的電子鼻數據校正方法,其特征在于:包括以下步驟:
1)搭建命名為FEDA的神經網絡,所述FEDA包括用于提取源域和目標域的域不變特征的特征提取器Gf、用來區分數據來自源域和目標域的域判別器Gd、用于計算域不變特征的L2范數損失的L2范數模塊Gl、用于數據類別的分類的標簽分類器Gy、用于計算類熵損失的類條件概率熵Ge和用于進行梯度反轉的梯度反轉層,所述梯度反轉層連接在特征提取器Gf和域判別器Gd之間;
所述特征提取器Gf的輸出作為類條件概率熵Ge,域判別器Gd,L2范數模塊Gl,以及標簽分類器Gy的輸入;數據分為標簽豐富的源域和無標簽的目標域,定義源域其中ns表示源域樣本數量,表示源域的第i個樣本,表示源域第i個樣本的標簽;其中nt表示源域樣本數量,表示目標域第j個樣本;源域數據的分布為P(Xs,Ys),目標域數據分布為Q(Xt,Yt),P≠Q;
2)進行領域對抗訓練:分別在特征提取器Gf和域判別器Gd上添加一個梯度反轉層,首先在數據正向傳播過程中訓練特征提取器Gf學習到域不變特征,從而讓域判別器Gd無法區分特征是來自源域和還是目標域,再通過最小化域分類損失Ld來訓練域判別器Gd,使得域判別器Gd可以區分源域和目標域特征;然后在數據反向傳播經過梯度反轉層的時候反轉梯度,讓特征提取器Gf無法正確判斷領域不變特征,以此完成對抗訓練;
在領域對抗訓練過程中,計算特征提取器Gf所提取特征的L2范數,并通過自適應的特征范數損失Lf使得源域和目標域的L2范數在大范圍上取得平衡;且類條件概率熵Ge采用最小化目標域條件熵Lh以減少目標域的類間重疊,增加類內同質性。
2.根據權利要求1所述的基于生成對抗網絡的電子鼻數據校正方法,其特征在于:在步驟2)中通過對抗損失Ld來訓練特征提取器Gf學習域不變特征,對抗損失Ld表述如下:
其中Xs,Xt表示源域和目標域,表示源域的第i個樣本,表示目標域第j個樣本。
3.根據權利要求2所述的基于生成對抗網絡的電子鼻數據校正方法,其特征在于:在步驟2)中梯度反轉層反轉Ld的梯度是把梯度替換為其中σ表示權重參數;把梯度反轉層的偽函數定義為Rσ(x),則梯度反轉表示為如下兩個函數:
其中I表示單位矩陣,x表示函數的輸入。
4.根據權利要求3所述的基于生成對抗網絡的電子鼻數據校正方法,其特征在于:步驟2)中所述自適應的特征范數損失是通過最大均特征分布差異的方式構造得到,構造步驟包括:
定義源域和目標域的最大平均特征分布差異如下:
其中MMFDD[Gf,Xs,Xt]為最大平均特征分布差;xi,xj分別表示源域和目標域的數據;構造一個距離Z來擬合源域和目標域之間的特征范數差距LZ,使源域和目標域的L2范數分別收斂到Z,從而使得MMFDD[Gf,Xs,Xt]最小,
再構造自適應的特征范數損失Lf,公式如下,
其中Δz表示殘差特征范數,wg表示權重參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學;勒威半導體技術(嘉興)有限公司,未經重慶大學;勒威半導體技術(嘉興)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210138121.7/1.html,轉載請聲明來源鉆瓜專利網。





