[發明專利]數據發布環境下面向結構化數據的隱私衡量算法在審
| 申請號: | 202110738805.6 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113378229A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 陳振宇;姚琳;吳國偉;閆鴻淼 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F16/906 |
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 溫福雪 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 發布 環境 面向 結構 隱私 衡量 算法 | ||
本發明屬于信息安全技術領域,提供了一種數據發布環境下面向結構化數據的隱私衡量算法。首先,數據源收集用戶信息并生成用戶信息摘要,根據摘要信息篩選外部數據集并計算屬性相似度以區分私有屬性和非私有屬性。然后,計算私有屬性的外部內部平均信息量和分布信息量,依托需求和時間損失對私有屬性定價識別敏感屬性,并應用最大熵原理提取準標識符,識別數據中的風險要素。最后,根據隱私模型對數據隱私進行衡量,并給出隱私導向的匿名技術,可以證明在該導向下的隱私和可用性達到了最佳均衡。
技術領域
本發明涉及一種數據發布環境下面向結構化數據的隱私衡量算法,屬于信息安全技術領域。
背景技術
大數據相關技術的飛速發展促進了各行各業對數據的重視,各式各樣的機構組織能夠通過大數據技術利用大量數據對其主營的業務優化升級以便在市場獲得更強的競爭優勢。與此同時,為了防止對大數據技術掌握更深的少數互聯網巨頭利用自身在大數據技術上的優勢進行壟斷,影響市場穩定性;數據共享的呼聲不斷高漲。而與數據共享伴隨而來的隱私問題卻成了影響數據共享的另類瓶頸,若不能妥善的解決隱私問題,大規模的數據共享就難以實現,巨頭利用優勢進行壟斷便會成為必然。發布數據作為數據共享的主要手段,其中的隱私保護問題得到了國內外的廣泛關注,產生了各式各樣的隱私保護算法與模型。
在發布環境中的隱私保護技術主要研究原數據到匿名數據的轉換,并確保匿名數據滿足某種分布時,其能夠有效防止數據隱私的泄露,隨后將匿名數據發布,這類技術也被稱為匿名技術。然而,不論是何種匿名技術,在對原數據進行變換時,總是以一部分數據的真實性為代價,來換取數據整體上的隱私增強。而損失過多的數據真實性固然使得隱私得到了保證,卻與數據共享的目的背道而馳,倘若被共享的數據不再具有原數據中的價值,數據共享便失去了意義。
因此,匿名技術的研究始終圍繞著隱私性與可用性這一矛盾進行,以期許能發現某一匿名技術能夠實現隱私性與可用性的最佳均衡。然而,現有的匿名技術缺乏了隱私導向,即其在對原數據進行匿名操作之前并沒有根據數據的特點對數據進行保護,而是采取了全局統一的操作,這使得某些原本已經具有一定程度隱私的數據丟失了這部分的隱私,同時也丟失了這部分數據的可用性,不僅造成了計算開銷的浪費,也使得距離數據安全高效共享的目標始終差了一步。
以隱私導向為主的匿名技術必將成為未來研究發布數據匿名技術的重點。分析數據的隱私導向主要研究如下問題,對于需要匿名的數據,如何分析其隱私水平,使得對其進行的匿名操作盡可能少而又盡可能有效。在數據發布的背景來看,數據可能已經具有一定隱私上的特點,提取數據自身隱私特點,對接現有發布數據匿名技術,實現數據安全共享到數據安全高效共享的平滑過渡將成為未來大數據研究工作中的重點并引發世界關注。
發明內容
為了有效發掘結構化數據中的隱私特點,為匿名技術提供精準的隱私導向,本發明提出了一種面向結構化數據的隱私衡量算法。在該方案中,隱私衡量的主體為具有待發布數據的數據源,首先數據源向外界收集已發布數據集,運用屬性集合配對,對配對的條目數量進行分類,分離出數據源的私有屬性;然后,對私有屬性應用信息熵定價并分類定位數據中的敏感屬性,對非私有屬性應用最大熵原理提取數據中的準標識;最后定義隱私模型,從準標識符出發,衡量數據隱私,并給出達到指定隱私水平的最優權衡。
本發明的技術方案:
一種數據發布環境下面向結構化數據的隱私衡量算法,步驟如下:
(1)首先數據源生成本地數據所涉及用戶的摘要,并獲取具有相似摘要已發布數據集,并與這些數據集進行屬性集合配對,然后對配對數目進行分類,以便分離數據源私有屬性;
數據集的時空屬性摘要生成與集合配對、分離私有屬性的具體過程如下:
(1.1)當數據源對某一特定用戶群體收集其相關信息時,數據源需生成統一格式的用戶摘要,摘要中的信息僅描述該數據集是哪一地區用戶收集的,又因其具有時效性,稱為時空摘要。首先定義數據集的組成如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110738805.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鐵路全封閉聲屏障降噪效果評價方法
- 下一篇:一種墩口用銅管生產工藝
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





