[發明專利]一種基于信念網絡的靶向型隱私保護數據發布方法有效
| 申請號: | 202110050995.2 | 申請日: | 2021-01-14 |
| 公開(公告)號: | CN112822004B | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 周志剛;白增亮;苗鈞重;余翔湛 | 申請(專利權)人: | 山西財經大學 |
| 主分類號: | H04L9/00 | 分類號: | H04L9/00;H04L9/40 |
| 代理公司: | 太原申立德知識產權代理事務所(特殊普通合伙) 14115 | 代理人: | 程園園 |
| 地址: | 030006 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 信念 網絡 靶向 隱私 保護 數據 發布 方法 | ||
本發明數據發布領域,具體涉及一種基于信念網絡的靶向型隱私保護數據發布方法。針對以知識挖掘為目標的大數據多源增量發布場景中對數據可用性與隱私保護的協同優化問題,提出一種基于信念網絡的靶向型隱私保護數據發布方法,代替發布原始數據,通過抽樣、生成、轉換等操作發布符合隱私?效用的信念網絡,在解決個體數據隱私泄露的同時極大地提升了數據共享的效率;為防范敵手通過濫用知識挖掘技術對隱私信息的過度分析以及通過異源數據的印證攻擊,提出(d,l)?privacy隱私保護架構,柔性地化解了隱私保護強度的提升對數據可用性的影響,并通過來自多個應用域的4個公開數據集來實證該方法的有效性。
技術領域
本發明數據發布領域,具體涉及一種基于信念網絡的靶向型隱私保護數據發布方法。
背景技術
隨著“互聯網+”行動計劃的穩步實施,將云計算、物聯網、人工智能等新型技術與各行各業結合起來,極大地撬動了以“大數據分析、內容咨詢服務”為核心的巨量市場。在合作共贏、共享經濟的大背景下,產業鏈上下游企業通過數據共享,分析產品從原料購進到銷售的各個環節,能夠有效減小產能過剩的風險;不同產業的公司也可以通過信息發布與共享的方式展開多元化產業合作,從而減緩單一領域產品受市場周期變化的沖擊。盡管數據融合分析可以為企業提供競爭優勢,但據研究機構Gartner對144名全球知名企業首席審計主管的調查顯示,隨著企業間的信息共享,數據分析的安全風險正在加劇,70%的受訪者表示為避免隱私泄露所帶來的負面影響,如何保護數據隱私是各方最關注的問題。
隱私保護的數據發布[1](Privacy-Preserving Data Publishing,簡稱PPDP)作為數據挖掘技術從數據中安全、合法依規提取知識的必要技術前件,在過去幾十年中受到相當大的關注。PPDP可以歸約為隱私挖掘與敏感信息匿名化的博弈:假設目標對象T具有一組信息屬性和一個敏感屬性,其中信息屬性值AI為可公開屬性(又稱為信息屬性),而敏感屬性值AS(又稱為隱私屬性)需要被匿名處理。在數據發布的過程中要求確保沒有人可以根據發布的匿名數據以高于閾值的概率猜測出由可公開屬性AI到敏感屬性AS的映射關系。在大數據場景中,PPDP的內涵得到了擴展。由于數據發布的目標是分析數據分布、探索數據之間的關系以及挖掘隱藏在大數據中的新知識,因此,其中所包含的敏感統計信息(下稱為宏隱私,相應地,稱個人敏感信息為微隱私)也需要進行相應的匿名化處理。
多源數據安全融合以隱私保護作為合作基礎,打破信息孤島的壁壘,在更廣泛數據集上挖掘知識產生協同,并最終按需實現有限開放的信息共享。縱觀國內外文獻,可以從隱私度量指標、隱私計算和面向多源數據融合的隱私保護技術3個方面進行梳理。
k-匿名(k-anonymity)要求對所發布的數據中的每一條記錄至少存在其它k-1條不能與之區分的記錄。其中,k作為“匿名度”直接表征了目標數據被保護程度的強弱。康奈爾大學的Machanavajjhala等人提出多樣性(1-diversity),該策略在k匿名的標準下限制每一個由信息屬性劃分的等價類中所對應的敏感屬性至少包含個不同的值。為了實現上述數據匿名策略,數據發布方通常采用數據泛化、插入噪聲數據、數據分割這三類方法對數據進行處理。然而,偽裝的數據需要“精心”設計,正如敵手可以以發布的宏觀統計數據為背景知識,通過基于統計推理的攻擊消除添加的偽數據。
此外,從k-匿名到多樣化性再到其后演化的諸多變種都圍繞彌補k匿名無力對抗背景知識攻擊來展開。對此,與之并行的差分隱私方案成為一個新的突破點。Dwork等人提出基于ε-差分隱私(ε-differential privacy)的隱私保護方案,其對數據隱私的保護與攻擊者掌握的背景知識無關。該準則利用指定參數ε表征添加噪聲的程度,遺憾的是,在面對高維稀疏數據時,差分隱私已被證明將嚴重的降低數據可用性。為了防止統計推測攻擊,普渡大學和ATT實驗室的李寧輝等人提出t-相近性(t-Closeness)原則,在多樣化的基礎上,考慮了敏感屬性值的分布問題,該策略將t作為“相近程度”的距離度量,表征在匿名數據中,敏感屬性值的分布與整體大數據中該屬性值分布的相近程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西財經大學,未經山西財經大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110050995.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:可逆微流控芯片夾具
- 下一篇:一種任務處理方法及裝置





