[發明專利]一種基于準標識屬性取值頻次的k-匿名隱私保護方法在審
| 申請號: | 201910122123.5 | 申請日: | 2019-02-19 |
| 公開(公告)號: | CN109918940A | 公開(公告)日: | 2019-06-21 |
| 發明(設計)人: | 肖躍雷;朱志祥 | 申請(專利權)人: | 陜西省信息化工程研究院 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 710075 陜西省西安*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標識屬性 全域 匿名模型 隱私保護 發布 數據分布 數據分析 信息損失 層次樹 重復 檢驗 | ||
1.一種基于準標識屬性取值頻次的k-匿名隱私保護方法,其特征在于:該方法包括:
1)對于待發布數據表中的各個準標識屬性,根據數據分布情況和業務情況建立各個準標識屬性的泛化層次樹;
2)對于待發布數據表中的各個準標識屬性,計算各個準標識屬性的屬性取值個數、屬性取值頻次和屬性取值熵值;
3)對于待發布數據表中的各個準標識屬性,按照屬性取值頻次最小、屬性取值個數最多和屬性取值熵值最小的優先順序,選擇一個準標識屬性進行一個層次的全域泛化;
4)對步驟3)中全域泛化后待發布數據表進行k-匿名模型檢驗;若符合k-匿名模型,則以步驟3)中全域泛化后待發布數據表為最終發布數據表;否則,重復進行步驟2)、步驟3)和步驟4)。
2.根據權利要求1所述的基于準標識屬性取值頻次的k-匿名隱私保護方法,其特征在于:所述步驟1)的具體過程如下:
步驟11)選取待發布數據表中的一個準標識屬性,計算該準標識屬性各個屬性取值的頻次;
步驟12)根據該準標識屬性各個屬性取值的頻次分布,以及該準標識屬性的業務層次建立該準標識屬性的泛化層次樹,使得:該準標識屬性在全域泛化下,該準標識屬性泛化層次樹中每個層次的屬性取值頻次分布比較均勻;
步驟13)重復進行步驟11)和步驟12),直至待發布數據表中各個準標識屬性的泛化層次樹都已建立完成。
3.根據權利要求1所述的基于準標識屬性取值頻次的k-匿名隱私保護方法,其特征在于:所述步驟2)的具體過程如下:
步驟21)選取待發布數據表中的一個準標識屬性,計算該準標識屬性各個屬性取值的個數、頻次和熵值,即該準標識屬性的屬性取值個數、屬性取值頻次和屬性取值信息熵值,其中該準標識屬性的屬性取值信息熵值是對該準標識屬性的各個屬性取值進行信息熵計算得到的;
步驟22)重復進行步驟21),直至待發布數據表中各個準標識屬性的屬性取值個數、屬性取值頻次和屬性取值熵值都已計算完成。
4.根據權利要求1所述的基于準標識屬性取值頻次的k-匿名隱私保護方法,其特征在于:所述步驟3)的具體過程如下:
步驟31)若屬性取值頻次最小的準標識屬性只有一個時,則對該準標識屬性進行一個層次的全域泛化;否則,執行步驟32);
步驟32)針于屬性取值頻次最小的這些準標識屬性,若屬性取值個數最多的準標識屬性只有一個時,則對該準標識屬性進行一個層次的全域泛化;否則,執行步驟33);
步驟33)針對屬性取值頻次最小和屬性取值個數最多的這些準標識屬性,選擇屬性取值熵值最小的準標識屬性進行一個層次的全域泛化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西省信息化工程研究院,未經陜西省信息化工程研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910122123.5/1.html,轉載請聲明來源鉆瓜專利網。





