[發明專利]一種基于屬性相關的差分隱私保護方法有效
| 申請號: | 201810589946.4 | 申請日: | 2018-06-08 |
| 公開(公告)號: | CN108776763B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 董宇欣;陳福坤;褚慈;謝曉東;印桂生;韓啟龍;王紅濱;萬麗;秦帥;白云鵬 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 張換男 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 屬性 相關 隱私 保護 方法 | ||
1.一種基于屬性相關的差分隱私保護方法,其特征在于,包含以下步驟:
步驟一設輸入樣本X=[X1,X2,…XN],N為樣本個數,每一個樣本Xl=[xl1,xl2,…,xln]T∈Rn,n代表樣本Xl的維度,對輸入數據X進行標準化:得到標準化矩陣計算矩陣Z的最大信息系數矩陣Ci,j=MIC(zi,zj);其特征在于:
給定有序對數據集D={(xi,yi),i=1,2,...,n},將X軸分成數量為x的格子,將Y軸分成了數量為y的格子,從而得出x×y格式的網格劃分,并且用G表示,把位于D點同時進入了G中的網格而存在的比例判定為它的概率分配D|G;所有的數據集D,當其具有一定的固定性時,每一個網格劃分都有它自己的概率分布特征D|G;最大信息系數MIC定義為:
步驟二數據降維,構建投影算子;數據降維是采用線性變換的方式將高維空間的數據投影變換到低維空間上;
步驟三根據投影算子,將原始數據投影到另一個空間中,得到相應的投影矩陣;
計算Fk×n=Φ×Z,得到投影矩陣Fk×n,Z代表對輸入數據X進行標準化得到的標準化矩陣,Φ代表投影算子;對投影矩陣Fk×n中的元素fij添加噪聲,計算fij=fij+lap(Δf/ε),fij構成矩陣Fnoisy;添加服從拉普拉斯分布的噪聲,其中Δf為全局敏感度,ε是隱私預算的2倍;
步驟四計算D=Uk×Fnoisy+repmat(Enoisy,1,n),即將加噪后的投影矩陣還原,Uk是線性變換還原系數;E為原始特征變量對應的均值,Enoisy為加噪后均值,防止均值泄露隱私;
步驟五發布還原數據集D,使得發布后的數據能夠在差分隱私的框架下為相關的查詢和數據挖掘工作提供支持。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810589946.4/1.html,轉載請聲明來源鉆瓜專利網。





