[發明專利]基于組內重排的多敏感屬性隱私保護方法有效
| 申請號: | 202011633266.1 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112784294B | 公開(公告)日: | 2022-09-20 |
| 發明(設計)人: | 姚琳;王雪;吳國偉 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 溫福雪;侯明遠 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 重排 敏感 屬性 隱私 保護 方法 | ||
本發明屬于信息安全技術領域,一種基于組內重排的多敏感屬性隱私保護方法。首先,通過計算每兩列敏感屬性SA間各種取值組合的提升度來衡量SA和SA屬性值之間的相關性,如果提升度大于1,則表明正相關,需將具有相關性的取值組合進行隱匿,直到提升度降到1及以下。然后,通過統計每列準標識符屬性QI和各列SA屬性之間的取值情況,計算該QI和SA屬性之間的卡方值,查卡方分布表判斷是否具有相關性,當至少一列SA與當前QI相關則停止對該QI的檢驗,從而將QI屬性劃分成與SA有相關性和無相關性兩類,接著對數據表進行多維桶分組,形成令每個SA都滿足L多樣性的分組,最后對與SA屬性具有相關性的QI列進行組內重排。
技術領域
本發明涉及一種基于組內重排的多敏感屬性隱私保護方法,屬于信息安全技術領域。
背景技術
隱私保護數據發布(PPDP)是一種很有前途的信息共享方法,能夠同時保護個人隱私和敏感信息。像是金融、醫療、電商等領域均離不開大量的數據發布。生活中,相比于單維敏感數據(SSA),對多維敏感數據(MSA)的使用更為常見。然而數據的共享使用也帶來了各種各樣的隱私泄露問題,為人們的日常生活增添了許多安全隱患。目前隱私保護方法大多是針對單敏感屬性泄露制定的隱私模型,如k-匿名、l-多樣性、t-貼近三大基礎模型,主要運用泛化、解構、排列、擾動等匿名技術進行實現。而對多敏感屬性數據保護運用的隱私模型也大都是從這三大類基本模型稍加改進演變而來。
隨著數據挖掘、機器學習等技術的發展,對數據的保護已不單單是記錄鏈接攻擊、屬性鏈接攻擊、表鏈接攻擊以及概率攻擊這四大類,越來越多的針對多維數據的關聯性攻擊開始出現,即利用屬性彼此間的相關關系來推測可能的隱私數據取值,從而造成嚴重的信息披露。各個屬性之間可能蘊含一定的關系,例如,年齡可能跟婚姻狀況有聯系,而婚姻狀況可能又與工資等經濟狀況相聯系。如果不考慮這些屬性之間的相關性,就算對單個屬性進行了諸如泛化之類的處理,攻擊者依然可以利用屬性間的相關性信息來進行推測,從而獲取敏感數據。
現有基礎模型都不能對屬性間的關聯性攻擊進行很好的抵御。后來有學者提出了Rating發布模型以及對該模型的幾種改進算法來解決多敏感屬性之間的關聯信息的泄露問題,但也存在一定的缺陷,比如模型整體基于泛化表,對全部的敏感屬性均進行泛化,導致數據可用性較低;同時對頻繁項集的界定依賴于主觀的支持度設定,并無法過濾無效關聯關系。
發明內容
為了有效解決多敏感屬性數據各屬性之間的相關性信息泄露問題,本發明提出了一種基于組內重排的多敏感屬性隱私保護方法。該方案首先提出一個處理SA和SA屬性之間相關性的方法,對具有相關性的SA取值組合進行部分隱匿,防止敏感屬性間的關聯攻擊。然后,本發明將SA和QI屬性之間的相關性也進行了檢驗和處理,能夠防止準標識符對敏感屬性信息的泄露。最后,由于算法采用了排列及多維桶分組技術,所以本發明也可以抵御基本的鏈接攻擊。
本發明的技術方案:
一種基于組內重排的多敏感屬性隱私保護方法,步驟如下:
定義變量:
表1常用的變量及說明
具體步驟如下:
(1)檢驗SA和SA屬性值之間的相關性,并對具有相關性的SA屬性值組合進行部分隱匿處理,使相關性水平降到標準以下;
對SA和SA屬性值之間的相關性處理,具體過程如下:
(1.1)首先運用提升度公式求出每兩列SA屬性中具有正相關關系的取值組合,同時過濾掉無關和具有負相關關系的取值組合;
提升度(lift):是一種簡單的相關性度量,通過兩個屬性值在數據表中的出現概率來衡量,公式定義如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011633266.1/2.html,轉載請聲明來源鉆瓜專利網。





