[發明專利]一種基于R-鄰域關系與差分隱私的四分樹隱私保護方法在審
| 申請號: | 202111006902.2 | 申請日: | 2021-08-30 |
| 公開(公告)號: | CN113704788A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 鄒云峰;許道強;江明;單超;朱峰 | 申請(專利權)人: | 國網江蘇省電力有限公司營銷服務中心;國網江蘇省電力有限公司 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F21/62;G06F21/64 |
| 代理公司: | 北京智繪未來專利代理事務所(普通合伙) 11689 | 代理人: | 張紅蓮;王萍 |
| 地址: | 210019 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 鄰域 關系 隱私 四分樹 保護 方法 | ||
1.一種基于R-鄰域關系與差分隱私的四分樹隱私保護方法,其特征在于,包括以下步驟:
步驟1,獲取數值型關系原數據集D,計算原數據集D中任意兩條數據記錄之間的距離,并設置四分樹深度約束值h和隱私預算ε;
步驟2,以步驟1的計算結果和設置的值,計算原數據集D中每條數據記錄k鄰域半徑,選擇最小的k鄰域半徑,作為后續構建四分樹所使用的鄰域半徑R的值;
步驟3,以步驟1的計算結果和步驟2獲得鄰域半徑R的值,構造原數據集D中每條數據記錄的R-鄰域,計算R-鄰域密度、數據記錄間R-鄰域相似度、數據記錄間R-鄰域近聚度;
步驟4,按照步驟3獲得的原數據集D中每條數據記錄的R-鄰域密度大小,對數據記錄進行排序,計算分裂閾值;
步驟5,以步驟4的排序結果,根據R-鄰域近聚度,構建原數據集D的四分樹;
步驟6,根據四分樹實際深度為realH,分配隱私預算,添加拉普拉斯噪聲,獲得加噪聲數據集D*;
步驟7,將加噪聲數據集D*提交給不可信數據挖掘方,供其使用。
2.根據權利要求1所述的一種基于R-鄰域關系與差分隱私的四分樹隱私保護方法,其特征在于:
步驟1中,原數據集D為供電數據集,為數值型關系數據集。
3.根據權利要求1所述的一種基于R-鄰域關系與差分隱私的四分樹隱私保護方法,其特征在于:
步驟1具體包括:
步驟1.1,獲取數值型關系原數據集D,以如下公式表示,
xp∈D,p=1,2,…,N
式中:
xp表示原數據集D中的第p條數據記錄,
N表示原數據集D中數據記錄的條數,
m表示原數據集D中數據記錄的屬性數目,
表示xp的第i個屬性的數值;
步驟1.2,對于數據記錄xp,xq∈D,計算數據記錄xp,xq之間的距離,以如下公式表示,
式中:
d(xp,xq)表示數據記錄xp,xq之間的距離,
m表示數值型關系原數據集D中數據記錄的屬性數目,
表示xp的第i個屬性的數值,表示xq的第i個屬性的數值。
步驟1.3,設置四分樹深度約束值h;設置隱私預算ε。
4.根據權利要求3所述的一種基于R-鄰域關系與差分隱私的四分樹隱私保護方法,其特征在于:
步驟1.3中,四分樹深度約束值h的取值范圍為大于等于2且小于N的整數;隱私預算ε的取值范圍為大于0小于1。
5.根據權利要求3或4所述的一種基于R-鄰域關系與差分隱私的四分樹隱私保護方法,其特征在于:
步驟2具體包括:
步驟2.1,以步驟1獲得的原數據集D中數據記錄的條數和設置的四分樹深度約束值h,計算k值,以如下公式表示,
式中:
N表示原數據集D中數據記錄的條數,
h表示四分樹深度約束值h,
步驟2.2,以步驟2.1計算獲得的k值,計算原數據集D中每條數據記錄的k鄰域半徑,以k-R(xp)表示數據記錄xp的k鄰域半徑,數據記錄xp的k鄰域半徑k-R(xp)滿足的約束條件為,原數據集D中與數據記錄xp之間的距離小于等于k-R(xp)的數據記錄數目恰好為k,選擇最小的k鄰域半徑,作為后續構建四分樹所使用的鄰域半徑R的值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網江蘇省電力有限公司營銷服務中心;國網江蘇省電力有限公司,未經國網江蘇省電力有限公司營銷服務中心;國網江蘇省電力有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111006902.2/1.html,轉載請聲明來源鉆瓜專利網。





