[發明專利]一種基于差分隱私的直方圖數據發布方法在審
| 申請號: | 202110941113.1 | 申請日: | 2021-08-17 |
| 公開(公告)號: | CN113743477A | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 孟博;張國興;王德軍;覃俊 | 申請(專利權)人: | 中南民族大學;武漢空天軟件技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 羅飛 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隱私 直方圖 數據 發布 方法 | ||
本發明提供了一種基于差分隱私的直方圖數據發布方法,包括如下步驟:步驟1:設置聚類中心點數K;步驟2:在直方圖數據中隨機選取一個點為初始中心點,按照非中心點與中心點之間的最短距離結合指數機制,計算出每個直方圖桶的抽樣概率,利用輪盤抽樣選取剩余的中心點;步驟3:利用得到的聚類中心點對原始直方圖數據進行聚類分組;步驟4:對劃分后的各分組求均值;步驟5:對各分組添加拉普拉斯噪音;步驟6:對差分隱私處理后的直方圖數據進行發布,本發明在提升數據發布效率的同時,可以提高數據可用性。
技術領域
本發明涉及直方圖數據發布技術領域,尤其涉及一種基于差分隱私的直方圖數據發布方法。
背景技術
直方圖是一種表示數據統計信息的常用方法,該方法將發布的數據按照屬性劃分成不相交的桶,數據特征則用桶計數來表示。直方圖在數據共享、數據發布領域有著廣泛的應用。企業可以將用戶數據采集,匯總成為直方圖提供給第三方進行數據挖掘,從而獲取潛在的、有價值的信息,用于決策。在此過程中第三方數據挖掘者為不可信的角色,攻擊者通過獲取足夠的背景知識,可以結合直方圖推斷出用戶信息,導致用戶的隱私信息泄露。為了保護用戶的隱私信息,數據在發布前需要對其進行隱私保護處理。早期的隱私保護方法主要包括屬性泛化和匿名,但當攻擊者擁有足夠多的背景知識時,即使數據經過一定的泛化或者匿名,依然存在隱私泄露的可能。
差分隱私作為一種隱私保護的常用技術,是一種嚴謹的數學模型,能夠為隱私保護提供可以量化的保證。其在直方圖數據發布領域有著廣泛的應用,但在對直方圖進行差分隱私保護的同時會降低數據的可用性。
發明內容
本發明提出一種基于差分隱私的直方圖數據發布方法,用于解決或者至少部分解決現有差分隱私保護方法中數據可用性不高的技術問題。
為了解決上述技術問題,本發明提供了一種基于差分隱私的直方圖數據發布方法,包括:
S1:對原始直方圖數據設置中心點的數量K;
S2:在直方圖數據中隨機選取一個點作為初始中心點,利用非中心點與中心點之間的最短距離結合指數機制,計算出每個直方圖桶的抽樣概率,利用輪盤抽樣從所有非中心點中依次選取出下一次作為中心點的點,直到中心點的數量達到K;
S3:利用選取好的K個中心點對直方圖數據H(H1,H2,...,Hn)進行K-means聚類得到分組數據G(G1,G2,...,Gk),其中,H1、H2、Hn分別表示第一個直方圖數據、第二個直方圖數據和第n個直方圖數據,n表示直方圖數據的數量,G1、G2、Gk分別表示第一個分組數據、第二個分組數據和第k個分組數據,k表示分組的個數;
S4:對通過K-means聚類得到的各分組數據求平均值,得到分組數據的均值其中,分別表示第一個分組數據的均值、第二個分組數據的均值和第k個分組數據的均值;
S5:在各分組數據均值上添加拉普拉斯噪聲,并還原直方圖順序,得到差分隱私直方圖數據其中,分別表示第一個差分隱私直方圖數據、第二個差分隱私直方圖數據和第n個差分隱私直方圖數據;
S6:對差分隱私保護直方圖數據進行發布。
在一種實施方式中,步驟S1中的中心點數量K預先給定,其中K=1,2,3,...,n。
在一種實施方式中,步驟S2包括:
S2.1:在原始直方圖數據中隨機選取一個桶作為初始中心點,一個桶對應一個直方圖數據;
S2.2:計算每個非中心點桶到中心點桶的最短距離:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南民族大學;武漢空天軟件技術有限公司,未經中南民族大學;武漢空天軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110941113.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





