[發明專利]隱私保護方法和裝置有效
| 申請號: | 201910709096.1 | 申請日: | 2019-08-01 |
| 公開(公告)號: | CN110443068B | 公開(公告)日: | 2022-03-22 |
| 發明(設計)人: | 喻民;黃偉慶;夏劍鋒;劉超;姜建國;李敏;安韶華 | 申請(專利權)人: | 中國科學院信息工程研究所 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F16/22 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 吳歡燕 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 隱私 保護 方法 裝置 | ||
本發明實施例提供一種隱私保護方法和裝置。其中,隱私保護方法包括:將與用戶敏感信息相關的原始數據表,根據原始數據表之間關聯的鍵值進行合并,獲取合并表;根據合并表中敏感屬性的鍵值名,對合并表中的數據記錄進行分組,并根據分組結果對合并表進行分解,獲取多張發布數據表。本發明實施例提供的隱私保護方法和裝置,通過將同一數據庫中多個包含用戶關聯信息的數據表作為一個整體進行分析,獲得合并表,并利用數據庫的相關理論和多維敏感屬性隱私保護方法對合并表進行分解,獲取多張發布數據表,能實現對多表多隱私屬性的隱私保護,能有效地提升隱私保護效果、提升數據處理效率同時提高數據的可用性。
技術領域
本發明實施例涉及計算機技術領域,尤其涉及一種隱私保護方法和裝置。
背景技術
伴隨信息化的發展,高度的數據收集和共享機制為各種數據挖掘工作提供了巨大的便利,同時也增加了個人隱私信息泄露的風險。為了降低個人隱私信息泄露的風險,需要對收集的數據進行數據隱私保護后,再進行發布或共享。
數據隱私保護的研究目標主要有兩個:一是在發布或共享數據后,防止攻擊者獲得個人相關的敏感屬性或者防止泄露具體個人的身份特征;二是采用的數據隱私保護技術應盡可能地減少對原始數據的影響,保持較高的數據可用性。
目前對于關系型數據的隱私保護大多采用匿名的隱私保護技術,匿名的隱私保護技術主要分為以下幾種:基于泛化的匿名、基于聚類的匿名和基于數據分解的匿名。
基于泛化技術的匿名隱私保護原理為將準標識符屬性進行泛化,將原始數據記錄中的各準標識符屬性值均統一使用泛化后的值代替,使得原始數據表中準標識符屬性與敏感屬性的一對一對應關系變為一對多的關系,以此達到隱私保護的目的。
基于聚類的匿名技術,通過對準標識符屬性進行聚類,用類的質心代替原始的準標識符屬性,以此實現準標識符屬性與敏感屬性由原先的一對一關系變為了一對多的關系的目的。聚類技術與泛化的本質相同,都是讓準標識符屬性用相同的值代替,但是采取的技術手段不同。
基于數據分解的匿名技術是將準標識符屬性與敏感屬性分成兩個不同的表進行發布和公開,一次切斷準標識符屬性和敏感屬性之間的直接關聯關系,達到隱私保護的目的。數據分解技術主要利用的是數據記錄表垂直分解后,如果沒有任何數據函數依賴關系的說明,相應數據記錄之間的連接存在多種對應的可能性,以此切斷敏感屬性與用戶個體之間的聯系,同樣獲得隱私保護的效果。
現有絕大部分隱私保護算法都存在計算復雜度高、數據可用性差的問題。現有的隱私保護技術大多使用基于泛化的匿名隱私保護技術,匿名隱私保護技術的核心在于數據分組算法,而基于泛化的保護技術在對數據分組前需要對準標識符屬性進行泛化,而后進行分組;這樣就導致了算法的搜索空間大,算法復雜度高,同時泛化會較大地影響數據可用性。而現實中,無時無刻的數據收集和存儲使得數據的規模往往非常龐大,算法的復雜度高將會影響數據的處理效率,同時較低的數據可用性將會降低數據的價值,影響數據的使用。
并且,現有的隱私保護技術只考慮了數據庫中單個數據表可能存在某個用戶多條相關數據記錄帶來的隱私安全問題,但并不能解決數據庫中其他數據表中同樣可能存在的用戶相關數據記錄導致的隱私泄露問題。個人和用戶的數據通常以數據記錄的形式存儲在數據表中保存在數據庫里,而在同一數據庫中,除了存在與用戶直接相關的個人信息數據表,還存在其他與個人間接相關的其他數據表,表與表之間通過各表相關的鍵值相互聯系。在這種情況下,通過關聯分析,用戶會存在很大的隱私泄露風險,因此,對于該種情況下的數據隱私保護是亟待解決的問題。
發明內容
針對現有技術存在的問題,本發明實施例提供一種克服上述問題或者至少部分地解決上述問題的隱私保護方法和裝置。
第一方面,本發明實施例提供一種隱私保護方法,包括:
將與用戶敏感信息相關的原始數據表,根據原始數據表之間關聯的鍵值進行合并,獲取合并表;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所,未經中國科學院信息工程研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910709096.1/2.html,轉載請聲明來源鉆瓜專利網。





