[發明專利]基于生成對抗網絡的電子鼻數據校正方法在審
| 申請號: | 202210138121.7 | 申請日: | 2022-02-15 |
| 公開(公告)號: | CN114511031A | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 劉然;陳希;毛虎;田逢春;錢君輝;崔珊珊;王斐斐;陳丹;陳鑫;任席偉;王仕丹 | 申請(專利權)人: | 重慶大學;勒威半導體技術(嘉興)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重慶信航知識產權代理有限公司 50218 | 代理人: | 吳彬 |
| 地址: | 400030 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生成 對抗 網絡 電子 數據 校正 方法 | ||
本發明基于生成對抗網絡的電子鼻數據校正方法,其包括1)搭建命名為FEDA的神經網絡,2)進行領域對抗訓練:分別在特征提取器Gf和域判別器Gd上添加一個梯度反轉層,首先在數據正向傳播過程中訓練特征提取器Gf學習到域不變特征,從而讓域判別器Gd無法區分特征是來自源域和還是目標域,再通過最小化域分類損失Ld來訓練域判別器Gd,使得域判別器Gd可以區分源域和目標域特征;然后在數據反向傳播經過梯度反轉層的時候反轉梯度,讓特征提取器Gf無法正確判斷領域不變特征,以此完成對抗訓練。本發明基于生成對抗網絡的電子鼻數據校正方法,降低了源域和目標域的分布差異,增加了類內同質性,解決電子鼻數據的域適應問題,能提高對傳感器漂移數據集的分類正確率。
技術領域
本發明涉及傳感器數據識別技術領域,特別涉及一種電子鼻數據的校正方法。
背景技術
傳感器漂移是指在輸入量不變的情況下,傳感器輸出量隨著時間變化的現象。引起傳感器漂移的一個原因是傳感器老化、中毒或者環境波動等非主觀因素,由此產生的傳感器漂移數據集包括長期漂移集和短期漂移數據集。引起傳感器漂移的一個原因是板間差異,即傳感器及相應的硬件在制造時產生的偏差,由此產生的傳感器漂移數據為板間差異數據集。除了時間漂移和板間漂移,更復雜的情況是傳感器既存在時間漂移也存在板間漂移,由此產生的傳感器漂移數據集為混合漂移數據集。
機器學習的默認假設是訓練集和測試數據是獨立同分布的。上述兩個現象導致了現有的模型無法對產生漂移(傳感器漂移和板間差異統稱漂移)的數據進行準確分類。具體到電子鼻系統領域,傳感器漂移是電子鼻系統不可規避的一個問題,電子鼻數據因時間漂移或板間差異導致了數據分布不一致,進而導致了數據集之間的類內非同質性,影響機器學習模型的分類準確率,進而限制了電子鼻系統的推廣和應用。
發明內容
有鑒于此,本發明的目的是提供一種基于生成對抗網絡的電子鼻數據校正方法,以解決傳感器漂移問題導致電子數據分布不一致,進而導致了數據集之間的類內非同質性的技術問題。
本發明基于生成對抗網絡的電子鼻數據校正方法包括以下步驟:
1)搭建命名為FEDA的神經網絡,所述FEDA包括用于提取源域和目標域的域不變特征的特征提取器Gf、用來區分數據來自源域和目標域的域判別器Gd、用于計算域不變特征的L2范數損失的L2范數模塊Gl、用于數據類別的分類的標簽分類器Gy、用于計算類熵損失的類條件概率熵Ge和用于進行梯度反轉的梯度反轉層,所述梯度反轉層連接在特征提取器Gf和域判別器Gd之間,
所述特征提取器Gf的輸出作為類條件概率熵Ge,域判別器Gd,L2范數模塊Gl,以及標簽分類器Gy的輸入;把數據分為標簽豐富的源域和無標簽的目標域,定義源域其中ns表示源域樣本數量,表示源域的第i個樣本,表示源域第i個樣本的標簽;其中nt表示源域樣本數量,表示目標域第j個樣本;源域數據的分布為P(Xs,Ys),目標域數據分布為Q(Xt,Yt),P≠Q;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學;勒威半導體技術(嘉興)有限公司,未經重慶大學;勒威半導體技術(嘉興)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210138121.7/2.html,轉載請聲明來源鉆瓜專利網。





