[發明專利]一種基于差分隱私的批量線性查詢方法有效
| 申請號: | 201810042656.8 | 申請日: | 2018-01-17 |
| 公開(公告)號: | CN108280366B | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 王迪;袁健;申澤宇 | 申請(專利權)人: | 上海理工大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 上海德昭知識產權代理有限公司 31204 | 代理人: | 郁旦蓉 |
| 地址: | 200093 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隱私 批量 線性 查詢 方法 | ||
1.一種基于差分隱私的批量線性查詢方法,其特征在于,包括以下步驟:
步驟1:查詢原始數據集R,得到數據查詢結果集M;
步驟2:將原始數據集R的屬性頻度按降序排列,設定最小支持度篩選頻度不大于最小支持度的屬性并將該屬性以及與該屬性對應的數據丟棄;將大于最小支持度的屬性采用FP-tree獲取數據的關聯屬性后進行數據無關性處理,得到屬性頻度大于所述最小支持度的無關數據集D;
步驟3:利用數據查詢結果集M,建立初始負載矩陣,利用步驟2中的屬性相關性在所述初始負載矩陣的基礎上建立數據無關負載矩陣W,采用并行梯度下降矩陣分解技術并行分解所述數據無關負載矩陣W,得到數據無關負載矩陣W的完整的分解結果的第一矩陣B以及分解結果的第二矩陣L;
步驟4:基于差分隱私進行自適應加噪,對所述分解結果的第二矩陣L以及所述屬性頻度大于所述最小支持度的無關數據集D添加拉普拉斯噪音,并對步驟2中丟棄的頻度不大于最小支持度的屬性以及該屬性對應的數據進行還原,獲得加噪查詢結果數據集S;
步驟5:將加噪查詢結果數據集S返回給用戶,
其中,分解結果的第一矩陣B和分解結果的第二矩陣L的梯度通過以下公式進行計算:
B=(βWLT+πLT)(βLLT+I)-1 (1)
公式(1)(2)中,T為轉置符號;β為正懲罰項因子,β需要初始化;I為單位矩陣;π為拉格朗日乘數。
2.根據權利要求1所述的基于差分隱私的批量線性查詢方法,其特征在于:
其中,步驟2中的基于關聯性分析的所述數據無關性處理包括以下步驟:
步驟2-1:對所述原始數據集R進行掃描,得出所述原始數據集R中每一個屬性的頻度,按照屬性頻度進行降序排列,得到屬性頻度降序列表;
步驟2-2:設定最小支持度,根據所述屬性頻度降序列表,將頻度不大于所述最小支持度的屬性及與該屬性對應的數據去掉;
步驟2-3:將去掉所述頻度不大于所述最小支持度的屬性及對應數據的剩余原始數據集R’以前綴樹進行存儲,構成FP-tree,并對第一次出現的節點建立鏈表;
步驟2-4:用FP-growth算法對FP-tree進行整理,挖掘出關聯模式;
步驟2-5:判斷葉子節點是否為單路徑,當判斷結果為是時,去除所述葉子節點,生成前綴路徑的集合,進入步驟2-6;當判斷結果為否時,生成各路徑前綴路徑的集合,構成一個新的FP-tree,返回至步驟2-4;
步驟2-6:獲取步驟2-5生成的所述前綴路徑的集合,定義為數據的關聯屬性;
步驟2-7:進行數據的無關性處理,利用屬性的關聯性去除冗余數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海理工大學,未經上海理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810042656.8/1.html,轉載請聲明來源鉆瓜專利網。





