[發(fā)明專利]事務(wù)型數(shù)據(jù)流發(fā)布的隱私保護方法有效
| 申請?zhí)枺?/td> | 201611198601.3 | 申請日: | 2016-12-22 |
| 公開(公告)號: | CN106778346B | 公開(公告)日: | 2019-10-15 |
| 發(fā)明(設(shè)計)人: | 王金艷;鄧超記;李先賢 | 申請(專利權(quán))人: | 廣西師范大學(xué) |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F16/9537 |
| 代理公司: | 桂林市持衡專利商標事務(wù)所有限公司 45107 | 代理人: | 陳躍琳 |
| 地址: | 541004 廣*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 事務(wù) 數(shù)據(jù)流 發(fā)布 隱私 保護 方法 | ||
本發(fā)明公開一種事務(wù)型數(shù)據(jù)流發(fā)布的隱私保護方法,其采用了滑動窗口對數(shù)據(jù)進行匿名,滑動窗口能夠很好地處理最近數(shù)據(jù)信息,從而保證任何滑動窗口都滿足隱私要求并盡可能大地保持數(shù)據(jù)的有效性,以便數(shù)據(jù)挖掘者進行分析。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)安全技術(shù)領(lǐng)域,具體涉及一種事務(wù)型數(shù)據(jù)流發(fā)布的隱私保護方法。
背景技術(shù)
隨著網(wǎng)絡(luò)信息技術(shù)的高速發(fā)展,為滿足商業(yè)決策、科學(xué)研究等需求,大量含有個人隱私信息的數(shù)據(jù)被政府部門、商業(yè)機構(gòu)等存儲發(fā)布。數(shù)據(jù)發(fā)布作為信息共享的一種手段,在為數(shù)據(jù)交換和數(shù)據(jù)共享提供便利的同時,也對數(shù)據(jù)的隱私帶來嚴重的威脅。如果數(shù)據(jù)發(fā)布者不采取適當?shù)谋Wo措施,將會造成敏感數(shù)據(jù)的泄露,從而給數(shù)據(jù)所有者或企業(yè)帶來危害。數(shù)據(jù)發(fā)布中的隱私保護問題主要考慮以下兩個方面:①保證發(fā)布的匿名數(shù)據(jù)不泄露個體的隱私信息;②保證發(fā)布的匿名數(shù)據(jù)具有較高的可用性。其研究工作主要集中于如何設(shè)計隱私保護模型和數(shù)據(jù)處理方法更好地平衡隱私保護和數(shù)據(jù)可用性之間的矛盾。
事務(wù)型數(shù)據(jù)是一種常見的數(shù)據(jù)形式,它的每條記錄是一個項目集合,如用戶的購物數(shù)據(jù)等。對于事務(wù)型數(shù)據(jù),如果只做簡單的匿名處理就進行發(fā)布,并不能保證用戶的隱私不被泄露。假設(shè)攻擊者知道某個人的部分項目,如果只有少數(shù)幾條事務(wù)記錄包含這些項目,那么攻擊者就可能將個人與某條記錄對應(yīng)起來,從而獲得記錄中個人的隱私信息,如購買的敏感商品。事務(wù)型數(shù)據(jù)是高維稀疏的,相對于關(guān)系型數(shù)據(jù)而言,對其發(fā)布的隱私保護技術(shù)提出了更大的挑戰(zhàn)。由于數(shù)據(jù)挖掘的廣泛應(yīng)用,事務(wù)型數(shù)據(jù)發(fā)布的隱私保護問題引起了研究者的廣泛關(guān)注。
根據(jù)是否區(qū)分敏感項目和非敏感項目,事務(wù)型數(shù)據(jù)發(fā)布的隱私保護方法分為兩類:
一類是沿用了傳統(tǒng)關(guān)系型數(shù)據(jù)隱私保護的思維,將所有項目分為敏感和非敏感項目,并假定攻擊者的背景知識局限于非敏感項目。該類方法有:(h,k,p)-coherence隱私規(guī)則,該規(guī)則確保對于任意小于p個非隱私項目的組合,在處理后的數(shù)據(jù)中至少有k條記錄包含這個組合,而且含有隱私項目的記錄所占到的比例至多h;ρ-uncertainty隱私規(guī)則,假定攻擊者的背景知識不僅包含非敏感項目,同時可以包含敏感項目,限制隱私關(guān)聯(lián)規(guī)則置信度不超過ρ。
另一類沒有區(qū)分敏感項目和非敏感項目,一個項目同時是敏感的也是非敏感的。該類方法有:km-匿名模型,保證匿名后的數(shù)據(jù)集中,任何大小不超過m的項集的事務(wù)數(shù)至少為k,限制了攻擊者的背景知識不超過m,實際應(yīng)用中攻擊者的背景知識很難確定;k-匿名模型,不限定攻擊者的背景知識,保證任意記錄在數(shù)據(jù)集中有k-1條記錄與其相同。
然而,上述隱私模型及其相應(yīng)的匿名方法都是針對靜態(tài)事務(wù)型數(shù)據(jù)的。隨著物聯(lián)網(wǎng)的推廣以及大數(shù)據(jù)時代的到來,網(wǎng)絡(luò)點擊數(shù)據(jù)、電話呼叫記錄、網(wǎng)絡(luò)交易數(shù)據(jù)、大型超市的購物數(shù)據(jù)等通常表現(xiàn)為動態(tài)變化的數(shù)據(jù)流。為了實時分析用戶的行為,需要在數(shù)據(jù)流上連續(xù)地執(zhí)行挖掘算法,如果不經(jīng)過處理,用戶的隱私信息將被泄露。數(shù)據(jù)流具有海量性、實時性和動態(tài)變化性,傳統(tǒng)的隱私保護技術(shù)不能直接應(yīng)用于數(shù)據(jù)流環(huán)境中。這就需要針對事務(wù)型數(shù)據(jù)流設(shè)計新的隱私保護技術(shù)。
發(fā)明內(nèi)容
本發(fā)明針對事務(wù)型數(shù)據(jù)流發(fā)布的隱私保護問題,提供一種事務(wù)型數(shù)據(jù)流發(fā)布的隱私保護方法。
為解決上述問題,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
事務(wù)型數(shù)據(jù)流發(fā)布的隱私保護方法,具體包括如下步驟:
步驟1、將初始滑動窗口的數(shù)據(jù)轉(zhuǎn)換成覆蓋集,并用靜態(tài)匿名方法對其進行匿名使其滿足ρ-uncertainty(ρ-不確定性)并發(fā)布;
步驟2、對滑動窗口進行動態(tài)匿名,根據(jù)刪除和增加的事務(wù)建立受影響的敏感關(guān)聯(lián)規(guī)則樹ASRT,并用payoff樹對項目進行抑制;
步驟2.1、對敏感關(guān)聯(lián)規(guī)則樹ASRT進行初始化,建立根結(jié)點和第一層結(jié)點,所有敏感項目作為第一層結(jié)點;同時,初始化前綴長度標識m,令m=1;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣西師范大學(xué),未經(jīng)廣西師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611198601.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種事務(wù)處理的方法和裝置
- 分布式事務(wù)處理方法與系統(tǒng)
- 一種融合原生事務(wù)和邏輯事務(wù)的方法
- 用于聚結(jié)內(nèi)存事務(wù)的方法和系統(tǒng)
- 事務(wù)處理方法、事務(wù)參與節(jié)點及事務(wù)協(xié)調(diào)節(jié)點
- 跨進程分布式事務(wù)控制方法及相關(guān)系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 一種分布式事務(wù)處理的智能監(jiān)控方法及服務(wù)器
- 分布式事務(wù)處理方法及裝置
- 讀寫事務(wù)控制方法、系統(tǒng)、終端設(shè)備及存儲介質(zhì)
- 編碼裝置,編碼方法,程序和記錄媒體
- 網(wǎng)絡(luò)數(shù)據(jù)流識別系統(tǒng)及方法
- 一種數(shù)據(jù)流調(diào)度的方法、設(shè)備和系統(tǒng)
- 一種確定待清洗數(shù)據(jù)流的方法及裝置
- 用于分析儀器化軟件的數(shù)據(jù)流處理語言
- 用于數(shù)據(jù)流系統(tǒng)的數(shù)據(jù)流處理方法及裝置
- 數(shù)據(jù)流調(diào)度系統(tǒng)以及數(shù)據(jù)流調(diào)度方法
- 采用向量處理的同時分割
- 汽車數(shù)據(jù)流的監(jiān)控方法、系統(tǒng)及可讀存儲介質(zhì)
- 一種數(shù)據(jù)流類型識別模型更新方法及相關(guān)設(shè)備
- 將發(fā)布數(shù)據(jù)發(fā)布至不同發(fā)布主機的系統(tǒng)及其方法
- 一種技術(shù)出版物內(nèi)容發(fā)布系統(tǒng)及方法
- 音/視頻流發(fā)布方法、流媒體服務(wù)器、發(fā)布端及流媒體系統(tǒng)
- 一種分布式代碼版本發(fā)布系統(tǒng)及方法
- 內(nèi)容發(fā)布方法、裝置、計算機設(shè)備以及可讀存儲介質(zhì)
- 文件發(fā)布方法和系統(tǒng)、發(fā)布服務(wù)器和文件生成裝置
- 軟件的發(fā)布質(zhì)量管理系統(tǒng)、方法以及裝置
- 信息發(fā)布方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)
- 信息發(fā)布方法及裝置、存儲介質(zhì)、終端
- 服務(wù)發(fā)布方法及裝置、服務(wù)器、存儲介質(zhì)





