[發明專利]一種基于深度學習的大數據隱私保護方法在審
| 申請號: | 202110507079.7 | 申請日: | 2021-05-10 |
| 公開(公告)號: | CN113158252A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 江耀;劉東升 | 申請(專利權)人: | 浙江工商大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06N20/00 |
| 代理公司: | 北京翔石知識產權代理事務所(普通合伙) 11816 | 代理人: | 薛曉軍 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 數據 隱私 保護 方法 | ||
本發明公開了一種大數據領域及計算機領域基于深度學習的大數據隱私保護方法,該方法的具體步驟如下S1通過眾包方式采集用戶數據;S2將采集的用戶數據存入云數據庫并進行格式統一;S3利用深度學習算法訓練出一個特征提取器;S4對特征提取器設置變量因子λ并調整λ數值得到最優解;S5利用訓練好的最優λ特征提取器從原始數據中提取特征;S6數據搜集器模塊匯總提取后的數據中間表征。本發明通過提出來一個可以提供隱私保護的數據特征提取器,保證從數據中提取出的特征盡可能少的包含所需要保護的隱私信息,滿足隱私安全性需求;同時保證提取的中間特征盡可能多的保留有效的信息,防止大數據時代用戶個人信息被濫用。
技術領域
本發明涉及大數據領域以及計算機技術領域,公開了大數據領域一種基于深度學習的大數據隱私保護方法。
背景技術
一方面隨著科技的發展,大數據行業發展空前繁榮,但是近年來,各種信息泄露事件頻繁發生,引發廣泛社會關注。數據共享的時代背景下,如何在數據收集過程中加強隱私保護,防止個人信息被濫用,儼然已成為重要研究課題。,另一方面,計算機技術的發展,深度學習技術日益成為人工智能行業的主流。但深度學習技術依賴大數據集,既需要通過數據集提取特征來學習訓練出高效的模型,也需要大量數據集來檢驗模型的效果。為了平衡大數據特征提取的有效性和個人隱私泄露之間的矛盾,我們提出了一種基于深度學習的大數據隱私保護方法投入使用,以解決上述問題。
發明內容
解決的技術問題
針對現有的大數據時代用戶信息泄露嚴重,個人隱私保護難的情況,本發明的目的在于提供一種基于深度學習的的大數據隱私保護方法,具備在保證用戶個人隱私信息不被泄露的同時兼顧數據集特征提取的有效性等優點,以解決上述背景技術中提出的問題。
本發明的技術方案如下:一種基于深度學習的大數據隱私保護方法包括應對眾包數據采集模塊、云數據庫存儲模塊、特征提取器模塊、數據搜集器模塊。
所述眾包數據采集模塊,通過產業眾包平臺、個人分包、企業分包等形式搜集企業機構或個人的原始信息數據,其中包括但不限于文本、音頻、視頻等形式。
所述云數據庫存儲模塊,根據上述規則每條收集到原始大數據信息進行規則劃分,其劃分包括對相似信息進行格式化統一分存入相應云數據庫中,使業務者能夠更快地理解和處理信息。
所述特征提取器模塊,利用深度學習技術訓練出一個特征提取器,將得到的原始大數據輸入特征提取器中,提取出任務需要的數據有效特征。
所述數據搜集器模塊,根據從原始數據中提取到的特征檢驗其有效性,將無效特征剔除,將剩余的有效特征提取。
優選的,云數據庫存儲系統采用安全性高,高并發量,動態獲取延時低的AWS或Oracle。并通過大數據的分析、統計以及常規習慣將信息進行預先處理,采用第三方工具Matplotlib或finebi。
優選的,所述特征提取器模塊通過引入可控參數λ來表示效用-隱私平衡因子,將特征有效性最大化和個人隱私泄露最小化兩個目標結合起來,得到最終的目標函數。
優選的,所述數據搜集器模塊無需傳輸原始數據,利用收集到的中間表征來訓練深度學習DNN模型,保證無法逆向還原出準確的受保護隱私信息,這使得任何人無法從原始數據中獲取用戶個人隱私信息。
有益效果
與現有技術相比,本發明的有益效果是:通過上述技術方案本發明提供的一種基于深度學習的大數據隱私保護方法,學習一個特征提取器,隱藏中間表征中的隱私信息,同時最大限度地保留原始數據中嵌入的原始信息,以供數據收集器完成未知的學習任務。與現有的表示學習和對抗學習法相比在安全性和通用性上領先,達到數據特征學習效果和隱私保護兩方面的相對平衡。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工商大學,未經浙江工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110507079.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





