[發明專利]一種基于生成式對抗網絡的涉密地理表格類數據保護方法有效
| 申請號: | 202110249303.7 | 申請日: | 2021-03-08 |
| 公開(公告)號: | CN113051604B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 宋軍;楊帆;陳諾;徐衡 | 申請(專利權)人: | 中國地質大學(武漢) |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 武漢知產時代知識產權代理有限公司 42238 | 代理人: | 彭建怡 |
| 地址: | 430000 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 網絡 地理 表格 數據 保護 方法 | ||
1.一種基于生成式對抗網絡的涉密地理表格類數據保護方法,其特征在于:具體包括以下步驟:
S101:獲取原始涉密表格類型數據;
S102:對涉密表格類型數據進行預處理,得到預處理后的訓練數據;
S103:利用預處理好的訓練數據訓練GDPGAN模型,得到訓練好的模型;所述GDPGAN模型由DCGAN模型和圖卷積神經網絡結合得到,包括生成器G、判別器D1和判別器D2;
S104:利用訓練好的模型生成虛假數據;
S105:將虛假數據替代原始數據進行發布,保護原始數據;
步驟S103具體為:
S301:利用隨機噪聲,生成隨機向量Z;
S302:將隨機向量Z輸入至GDPGAN模型的生成器G,生成得到原始涉密表格類型數據的虛假數據;
S303:將生成的虛假數據和預處理后的訓練數據一起輸入至GDPGAN模型的兩個判別器D1和D2中;判別器D1用于二分類,區分輸入的數據來自真實數據集合或虛假數據集合;判別器D2基于圖卷積神經網絡,用于對不同關聯圖進行分類;
S304:當判別器D1和D2無法區分真實數據和生成器生成的虛假數據時,GDPGAN模型訓練完畢;
判別器D1由多個卷積層組成;所述判別器D1的損失函數如下:
其中,I為真實數據集;x為輸入至判別器D1的真實數據集的樣本;I′為虛假數據集;x′為輸入至判別器D1的虛假數據集的樣本;
判別器D2的損失函數如下:
其中AG(·)為返回真實數據或虛假數據構造的關聯圖函數;表示輸入至判別器D2的真實數據樣本;表示輸入至判別器D2的虛假數據樣本;
所述GDPGAN模型的整體損失函數如下:
式(3)中noise(μ,σ)為真實數據集的高斯噪聲生成器;(x+noise(μ,σ))為真實數據中添加高斯噪聲后的一組數據,用于生成關聯圖;λ為預設值。
2.如權利要求1所述的一種基于生成式對抗網絡的涉密地理表格類數據保護方法,其特征在于:所述涉密表格類型數據包括統計類表格類型的數據和地理關聯性類型數據。
3.如權利要求1所述的一種基于生成式對抗網絡的涉密地理表格類數據保護方法,其特征在于:步驟S102具體為:
S201:將涉密表格中的每一條記錄轉換成方陣形式;
S202:對方陣添加高斯噪聲,形成經過噪聲擾動后的訓練數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國地質大學(武漢),未經中國地質大學(武漢)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110249303.7/1.html,轉載請聲明來源鉆瓜專利網。





