[發(fā)明專(zhuān)利]一種基于準(zhǔn)標(biāo)識(shí)屬性泛化的k-匿名隱私保護(hù)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910128727.0 | 申請(qǐng)日: | 2019-02-21 |
| 公開(kāi)(公告)號(hào): | CN109918941A | 公開(kāi)(公告)日: | 2019-06-21 |
| 發(fā)明(設(shè)計(jì))人: | 肖躍雷;朱志祥 | 申請(qǐng)(專(zhuān)利權(quán))人: | 陜西艾特信息化工程咨詢有限責(zé)任公司 |
| 主分類(lèi)號(hào): | G06F21/62 | 分類(lèi)號(hào): | G06F21/62 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 712000 陜西省咸陽(yáng)市西*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)識(shí)屬性 全域 匿名模型 隱私保護(hù) 發(fā)布 數(shù)據(jù)分布 層次樹(shù) 重復(fù) 檢驗(yàn) | ||
本發(fā)明提供了一種基于準(zhǔn)標(biāo)識(shí)屬性泛化的k?匿名隱私保護(hù)方法,其特殊之處在于:該方法包括:1)對(duì)于待發(fā)布數(shù)據(jù)表中的各個(gè)準(zhǔn)標(biāo)識(shí)屬性,根據(jù)數(shù)據(jù)分布情況和業(yè)務(wù)情況建立各個(gè)準(zhǔn)標(biāo)識(shí)屬性的泛化層次樹(shù);2)計(jì)算各個(gè)準(zhǔn)標(biāo)識(shí)屬性的泛化層次高度、屬性取值個(gè)數(shù)、屬性取值頻次和屬性取值熵值;3)按照泛化層次高度最大、屬性取值頻次最小、屬性取值個(gè)數(shù)最多和屬性取值熵值最小的優(yōu)先順序,選擇一個(gè)準(zhǔn)標(biāo)識(shí)屬性進(jìn)行一個(gè)層次的全域泛化;4)對(duì)步驟3)中全域泛化后的待發(fā)布數(shù)據(jù)表進(jìn)行k?匿名模型檢驗(yàn);若符合k?匿名模型,則以步驟3)中全域泛化后的待發(fā)布數(shù)據(jù)表為最終發(fā)布數(shù)據(jù)表;否則,重復(fù)進(jìn)行步驟2)、步驟3)和步驟4)。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)隱私保護(hù)領(lǐng)域,更具體地,涉及一種基于準(zhǔn)標(biāo)識(shí)屬性泛化的k-匿名隱私保護(hù)方法。
背景技術(shù)
隨著社會(huì)信息化和網(wǎng)絡(luò)化的發(fā)展,數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),大數(shù)據(jù)時(shí)代已經(jīng)到來(lái);目前,大數(shù)據(jù)已成為學(xué)術(shù)界和產(chǎn)業(yè)界的研究熱點(diǎn),正影響著人們?nèi)粘I睢⒐ぷ髁?xí)慣及思維方式;在數(shù)據(jù)發(fā)布應(yīng)用中,如何保護(hù)數(shù)據(jù)的用戶隱私已成為當(dāng)前面臨的重大挑戰(zhàn);最簡(jiǎn)單的保護(hù)用戶隱私的方法就是在發(fā)布原始數(shù)據(jù)時(shí)直接通過(guò)刪除姓名、身份證號(hào)碼等標(biāo)識(shí)屬性來(lái)達(dá)到防范用戶隱私泄露;但是由于以這種方式發(fā)布的數(shù)據(jù)集中的某些屬性值集合能夠聯(lián)合該數(shù)據(jù)集外的相關(guān)信息精確或較精確地重新標(biāo)識(shí)某個(gè)體,稱(chēng)之為鏈接攻擊。
為了解決這種鏈接攻擊,研究者們提出了k-匿名模型,它要求所發(fā)布的數(shù)據(jù)表中的每一條記錄不能區(qū)分于其他k-1條記錄,即在滿足k-匿名模型的數(shù)據(jù)表中,任意一條記錄被重新標(biāo)識(shí)出的風(fēng)險(xiǎn)都不會(huì)超過(guò)1/k;k-匿名模型通常將數(shù)據(jù)表的屬性劃分以下為四類(lèi):(1)標(biāo)識(shí)屬性:這類(lèi)屬性能夠唯一標(biāo)識(shí)個(gè)體身份的屬性,如用戶身份證號(hào)碼、姓名等;(2)準(zhǔn)標(biāo)識(shí)屬性:這類(lèi)屬性雖然不像標(biāo)識(shí)屬性一樣能夠直接標(biāo)識(shí)個(gè)體身份,但是通過(guò)屬性的鏈接可以標(biāo)記出個(gè)體身份的一組屬性,如準(zhǔn)標(biāo)識(shí)屬性組{年齡,工作類(lèi)型,膚色,性別};(3)敏感屬性:這類(lèi)屬性涉及個(gè)體隱私信息,如薪水、健康狀況等;(4)其它屬性:指除標(biāo)識(shí)屬性、準(zhǔn)標(biāo)識(shí)屬性和敏感屬性外的屬性。
一般遵循k-匿名模型的數(shù)據(jù)發(fā)布大多采用泛化和抑制技術(shù),這在很大程度上造成了原始數(shù)據(jù)的信息損失;泛化是對(duì)數(shù)據(jù)進(jìn)行更概括、更抽象的描述;抑制就是刪除某一些數(shù)據(jù)項(xiàng)使其不發(fā)布或是用一種特殊的符號(hào)來(lái)代替某一數(shù)據(jù)項(xiàng);例如,性別屬性的泛化層次樹(shù),參見(jiàn)圖1。
在圖1中,性別屬性的泛化層次為2(從底向上分別為0,1),而性別屬性的泛化層次高度為1,性別屬性的屬性取值為“男”、“女”和“性別”;泛化方法可以分為全域泛化和局部泛化兩種;全域泛化是對(duì)一個(gè)屬性上的所有屬性取值同時(shí)進(jìn)行泛化,如圖1中“男”和“女”同時(shí)泛化為“性別”;局部泛化是對(duì)一個(gè)屬性上的部分屬性取值進(jìn)行泛化,如圖1中“男”泛化為“性別”,而“女”不進(jìn)行泛化;全域泛化的優(yōu)點(diǎn)是每次屬性泛化完成后,該屬性上的所有屬性取值都保持在同一個(gè)泛化層次,有利于數(shù)據(jù)分析,而局部泛化不能保障這一點(diǎn);但是,全域泛化一般比局部泛化的信息損失要大;因此,如何使得發(fā)布的數(shù)據(jù)表在滿足k-匿名模型的同時(shí),既有利于數(shù)據(jù)分析又減少信息損失,這已成為隱私保護(hù)研究的重點(diǎn)。
發(fā)明內(nèi)容
為了解決背景技術(shù)中存在的上述技術(shù)問(wèn)題,本發(fā)明提供了一種既有利于數(shù)據(jù)分析又減少信息損失的基于準(zhǔn)標(biāo)識(shí)屬性泛化的k-匿名隱私保護(hù)方法。
本發(fā)明的技術(shù)解決方案是:本發(fā)明提供了一種基于準(zhǔn)標(biāo)識(shí)屬性泛化的k-匿名隱私保護(hù)方法,其特殊之處在于:該方法包括。
1)對(duì)于待發(fā)布數(shù)據(jù)表中的各個(gè)準(zhǔn)標(biāo)識(shí)屬性,根據(jù)數(shù)據(jù)分布情況和業(yè)務(wù)情況建立各個(gè)準(zhǔn)標(biāo)識(shí)屬性的泛化層次樹(shù)。
2)對(duì)于待發(fā)布數(shù)據(jù)表中的各個(gè)準(zhǔn)標(biāo)識(shí)屬性,計(jì)算各個(gè)準(zhǔn)標(biāo)識(shí)屬性的泛化層次高度,以及屬性取值個(gè)數(shù)、屬性取值頻次和屬性取值熵值。
3)對(duì)于待發(fā)布數(shù)據(jù)表中的各個(gè)準(zhǔn)標(biāo)識(shí)屬性,按照泛化層次高度最大、屬性取值頻次最小、屬性取值個(gè)數(shù)最多和屬性取值熵值最小的優(yōu)先順序,選擇一個(gè)準(zhǔn)標(biāo)識(shí)屬性進(jìn)行一個(gè)層次的全域泛化。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于陜西艾特信息化工程咨詢有限責(zé)任公司,未經(jīng)陜西艾特信息化工程咨詢有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910128727.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤(pán)或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 數(shù)據(jù)流處理方法和系統(tǒng)及管控節(jié)點(diǎn)單元
- 網(wǎng)絡(luò)數(shù)據(jù)的展示方法及裝置
- 一種建立通訊群組的方法及裝置
- 數(shù)據(jù)處理方法及裝置
- 一種詞典創(chuàng)建方法及設(shè)備
- 一種數(shù)據(jù)存儲(chǔ)的方法及裝置
- 一種基于ZigBee綁定的數(shù)據(jù)同步方法、設(shè)備及系統(tǒng)
- 日志處理方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及日志告警系統(tǒng)
- 一種基于用戶畫(huà)像的個(gè)性化顯示方法及裝置
- 一種面向機(jī)器的基于標(biāo)識(shí)知識(shí)庫(kù)的資源注冊(cè)、識(shí)別方法及相應(yīng)存儲(chǔ)介質(zhì)與電子裝置
- 多應(yīng)用智能卡及智能卡多應(yīng)用管理系統(tǒng)和方法
- 一種分布式安全域邏輯邊界保護(hù)方法
- 一種基于網(wǎng)絡(luò)隔離的兩級(jí)互聯(lián)裝置
- 一種資源分配的方法、設(shè)備及系統(tǒng)
- 一種基于信譽(yù)度評(píng)估的跨安全域訪問(wèn)控制系統(tǒng)和方法
- 安全控制方法及裝置
- 一種智能卡從安全域密鑰更新方法以及電子支付系統(tǒng)
- 一種用戶訪問(wèn)的控制方法及系統(tǒng)
- 安全域的生成方法、裝置及安全運(yùn)維監(jiān)管系統(tǒng)
- 基于多安全域的云平臺(tái)分級(jí)管理方法及裝置
- 一種模式信息損失最小化的序列類(lèi)數(shù)據(jù)隱私保護(hù)方法
- 一種適用于位置服務(wù)系統(tǒng)中面向連續(xù)查詢的位置匿名方法
- 一種面向路網(wǎng)的查詢感知的位置隱私保護(hù)系統(tǒng)
- 定性分析匿名模型的方法及裝置
- 一種實(shí)名/匿名一鍵切換通信客戶端
- 一種基于準(zhǔn)標(biāo)識(shí)屬性取值頻次的k-匿名隱私保護(hù)方法
- 一種基于準(zhǔn)標(biāo)識(shí)屬性泛化層高度的k-匿名隱私保護(hù)方法
- 一種基于準(zhǔn)標(biāo)識(shí)屬性泛化的k-匿名隱私保護(hù)方法
- 一種多叉樹(shù)森林K-匿名方法、系統(tǒng)、設(shè)備和可讀存儲(chǔ)介質(zhì)
- 實(shí)現(xiàn)隱私保護(hù)的數(shù)據(jù)處理方法及裝置
- 基于物聯(lián)網(wǎng)應(yīng)用場(chǎng)景的隱私查詢和隱私身份驗(yàn)證的保護(hù)方法
- 一種隱私保護(hù)的方法及系統(tǒng)
- 一種隱私保護(hù)系統(tǒng)
- 密碼設(shè)置方法及裝置
- 面向文本檢索服務(wù)的用戶隱私保護(hù)方法
- 視頻通話中隱私保護(hù)方法、系統(tǒng)、視頻通話終端及系統(tǒng)
- 一種隱私保護(hù)方法和移動(dòng)終端
- 一種基于差分隱私和關(guān)聯(lián)規(guī)則的需求隱私保護(hù)方法
- 一種隱私信息保護(hù)方法、裝置及系統(tǒng)
- 一種隱私信息管理方法、裝置和系統(tǒng)





