[發明專利]一種敏感數據發布中的隱私保護方法有效
| 申請號: | 201710043245.6 | 申請日: | 2017-01-19 |
| 公開(公告)號: | CN106874788B | 公開(公告)日: | 2019-10-08 |
| 發明(設計)人: | 李春花;周可;胡家琦 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 武漢臻誠專利代理事務所(普通合伙) 42233 | 代理人: | 向彬 |
| 地址: | 430074 湖北省*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 敏感數據 發布 中的 隱私 保護 方法 | ||
本發明公開了一種敏感數據發布中的隱私保護方法,包括:接收來自用戶的數據集以及對應的多個概化輸入樹,遍歷數據集中的每一組數據,并依次判斷該組數據中的每一列數據是否存在對應的概化輸入樹,如果存在,則根據該數據的屬性值在對應概化輸入樹中查找對應的節點,并將該節點的信息輸入到坐標數組中,如果不存在,則直接將該數據的屬性值輸入坐標數組中,從而得到m行坐標數組,并為每個坐標數組添加初始值為0的標志位,建立p個簇,從m行坐標數組中隨機選擇其中p行坐標數組分別作為建立的p個簇的中心點。本發明使用先聚類再概化的方法,不僅提高了計算效率,也為進行大規模計算奠定了基礎。
技術領域
本發明屬于計算機安全領域,更具體地,涉及一種敏感數據發布中的隱私保護方法。
背景技術
隨著互聯網技術的迅猛發展,各種互聯網應用如雨后春筍般噴涌而出。不可否認,這些互聯網應用很大程度地方便了我們的生活。但是在使用這些應用的同時,我們的各種行為數據也將被各大應用廠商所儲存。由于研究需要或其它目的,數據持有者需要將這些數據發布出去,從而導致用戶的隱私信息泄漏,大數據環境下隱私泄露問題日益突出,加密和隱藏數據發布過程中的敏感數據變得非常重要。敏感數據需要進行隱私保護,其主要目標是,消除用戶敏感數據和用戶身份信息之間的對應關系。
目前主流的隱私保護策略主要是采用k-匿名的隱私保護方法,實現k-匿名的算法有很多,例如有DATAFLY算法,該算法在實現k-匿名化的時候以表中的屬性為一組對于數據表中的所有元組進行K-匿名化;還有MDAV算法,該算法即先對數據集中數據進行劃分,針對每個k-匿名組再進行輸出。
上述采用k-匿名的隱私保護方法在選取構成k-匿名組的數據的時候是通過計算兩組數據之間的相似性來判斷的,要么對于屬性值為混合型數據時并沒有做過多探討,要么是簡單地認為當兩組數據在當前坐標下的屬性值相同則距離為0,屬性值不同則距離為1。這樣必然會造成兩組數據之間的相似性計算不準確,導致k-匿名組分配的不合理。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種敏感數據發布中的隱私保護方法,其目的在于,通過使用一種基于語義的概化輸入樹來進行數據之間的距離計算和數據的概化輸出,解決上述現有的方法中存在的由于相似性計算不準確,導致k-匿名組分配不合理的技術問題。
為實現上述目的,按照本發明的一個方面,提供了一種敏感數據發布中的隱私保護方法,包括以下步驟:
(1)接收來自用戶的數據集以及對應的多個概化輸入樹,該數據集具有m組,每組數據具有n個屬性;
(2)遍歷數據集中的每一組數據,并依次判斷該組數據中的每一列數據是否存在對應的概化輸入樹,如果存在,則根據該數據的屬性值在對應概化輸入樹中查找對應的節點,并將該節點的信息輸入到坐標數組中,如果不存在,則直接將該數據的屬性值輸入坐標數組中,從而得到m行坐標數組,并為每個坐標數組添加初始值為0的標志位;
(3)建立標志位分別為1,2,…,p的p個簇,從m行坐標數組中隨機選擇其中p行坐標數組分別作為建立的p個簇的中心點,其中0<p≤m;
(4)依次對m行坐標數組中的每一行,分別獲取其與p個中心點之間的距離,選取得到的p個結果中最小值對應的中心點對應的簇,將該行坐標數組添加到對應的簇中,并將當前行坐標數組的標志位設置為當前簇的標志位;
(5)重新獲取步驟(4)中得到的每個簇的中心點作為新的中心點;
(6)判斷步驟(5)獲得的新的中心點是否與對應的原中心點是否相同,如果相同則進入步驟(7),否則返回步驟(4);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710043245.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種圖像查看方法及移動終端
- 下一篇:一種基于身份替代的隱私保護方法及系統





