[發(fā)明專利]基于本地化差分隱私的頻繁項(xiàng)集挖掘方法在審
| 申請?zhí)枺?/td> | 202110852419.X | 申請日: | 2021-07-27 |
| 公開(公告)號: | CN113569286A | 公開(公告)日: | 2021-10-29 |
| 發(fā)明(設(shè)計(jì))人: | 倪巍偉;吳爾立;吳寧 | 申請(專利權(quán))人: | 東南大學(xué);國網(wǎng)江蘇省電力有限公司營銷服務(wù)中心 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06K9/62;G06F16/2458 |
| 代理公司: | 南京眾聯(lián)專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 本地化 隱私 頻繁 挖掘 方法 | ||
本發(fā)明公開了一種基于本地化差分隱私的的頻繁項(xiàng)集挖掘方法,包括以下步驟:步驟1:本地?cái)?shù)據(jù)保護(hù)階段:采用自適應(yīng)的編碼策略,根據(jù)編碼后0/1串中每一位上0與1的情況,產(chǎn)生擾動參數(shù)數(shù)組,依據(jù)該擾動數(shù)組應(yīng)用隨即響應(yīng)技術(shù)對數(shù)據(jù)進(jìn)行擾動;步驟2:聯(lián)合概率估計(jì)階段:對擾動之后的數(shù)據(jù),通過隱馬爾可夫模型進(jìn)行模型參數(shù)的學(xué)習(xí),并用參數(shù)計(jì)算估計(jì)聯(lián)合概率;步驟3:頻繁項(xiàng)集發(fā)現(xiàn)階段:根據(jù)步驟2結(jié)果構(gòu)建原始數(shù)據(jù)對應(yīng)的概率依賴圖,通過頻繁項(xiàng)集先驗(yàn)原理在概率圖中尋找頻繁項(xiàng)集。本發(fā)明可以支持多用戶端分布環(huán)境下兼顧個各個用戶數(shù)據(jù)隱私的頻繁項(xiàng)集挖掘。
技術(shù)領(lǐng)域
本發(fā)明涉及的是一種隱私保護(hù)數(shù)據(jù)挖掘方法,具體涉及的是一種基于本地化差分隱私的頻繁項(xiàng)集挖掘方法。
背景技術(shù)
近年來,隱私保護(hù)頻繁項(xiàng)集挖掘成為了研究者們關(guān)注的熱點(diǎn)問題。差分隱私以其保護(hù)效果有嚴(yán)格的數(shù)學(xué)定義和無需關(guān)心攻擊者的背景知識成為了當(dāng)前隱私保護(hù)領(lǐng)域的熱點(diǎn)技術(shù)。傳統(tǒng)的中心化差分隱私技術(shù),將數(shù)據(jù)集中到第三方數(shù)據(jù)中心,但在現(xiàn)實(shí)應(yīng)用中往往難以找到可信的第三方數(shù)據(jù)中心,所以通常采用本地化差分隱私技術(shù),該技術(shù)主要針對不存在可信第三方數(shù)據(jù)中心的分布式應(yīng)用場景,通過在用戶端對用戶敏感數(shù)據(jù)進(jìn)行擾動來保護(hù)用戶的隱私數(shù)據(jù)。定義如下
定義1.本地化差分隱私:給定一個算法Μ,若Μ對任意兩個用戶所持有的數(shù)據(jù)項(xiàng)V1和V2的輸出結(jié)果y∈Range(M),Range(M)表示算法M的值域。若算法M滿足下列不等式,則稱其滿足ε-本地化差分隱私(ε-LDP)。
Pr[M(V1)=y(tǒng)]≤eε×Pr[M(V2)=y(tǒng)]
上述定義可以看出,本地化差分隱私通過使任意兩項(xiàng)數(shù)據(jù)以一定概率產(chǎn)生相同的結(jié)果來保護(hù)用戶的隱私。本地化差分隱私主要采用隨即響應(yīng)技術(shù)對用戶數(shù)據(jù)進(jìn)行擾動?,F(xiàn)有本地化差分隱私保護(hù)頻繁項(xiàng)集挖掘方法主要存在以下問題:(1)傳統(tǒng)基于采樣的頻繁項(xiàng)集挖掘方法每次僅采樣一個值,需要多次與用戶端進(jìn)行交互獲取相關(guān)數(shù)據(jù)特征,通信代價(jià)較大,導(dǎo)致隱私預(yù)算增加,降低了隱私保護(hù)強(qiáng)度;(2)本地化差分隱私數(shù)據(jù)擾動協(xié)議的信噪比相對較大,多維數(shù)據(jù)在數(shù)據(jù)交互時(shí)會產(chǎn)生多種不同的數(shù)據(jù)組合,由于每一個屬性都會被擾動,組合后無疑會放大擾動數(shù)據(jù)中的噪聲,使得數(shù)據(jù)可用性降低;(3)多維數(shù)據(jù)中屬性的關(guān)聯(lián)性不可忽視,直接將已有的本地化差分隱私頻繁項(xiàng)挖掘技術(shù)應(yīng)用到多維數(shù)據(jù)會導(dǎo)致挖掘結(jié)果質(zhì)量降低。
發(fā)明內(nèi)容
本發(fā)明目的在于提供一種多維數(shù)據(jù)場景下的滿足本地化差分隱私的頻繁項(xiàng)集挖掘方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:一種基于本地化差分隱私的頻繁項(xiàng)集挖掘方法,該方法包括以下幾個步驟:步驟1用戶總數(shù)記為N,每個用戶都擁有包含k個屬性的記錄,編號為i的用戶擁有的記錄為Di={a1,a2,a3,...,ak},1≤i≤N,每一個屬性的值域記為Ωi,1≤i≤k,其中ai∈Ωi,所有值域的大小記為每個用戶對值域中所有可能的值進(jìn)行編碼進(jìn)而確定擾動所需要的參數(shù)數(shù)組f,f為長度為L的實(shí)數(shù)數(shù)組,其中將屬性值域中所有取值轉(zhuǎn)換為2進(jìn)制編碼的0/1串s其形如[0,1,1,0,...,0],因此編號為j的屬性的0/1串記為sj,1≤j≤m,則f中元素的計(jì)算方法為其中函數(shù)用戶依據(jù)如下擾動函數(shù)進(jìn)行對0/1串進(jìn)行擾動操作:
用戶擾動后將數(shù)據(jù)發(fā)送給不可信第三方進(jìn)行收集與模型重構(gòu)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué);國網(wǎng)江蘇省電力有限公司營銷服務(wù)中心,未經(jīng)東南大學(xué);國網(wǎng)江蘇省電力有限公司營銷服務(wù)中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110852419.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程





