[發明專利]基于本地化差分隱私的高維數據發布方法及相關設備有效
| 申請號: | 202110351651.5 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN113094746B | 公開(公告)日: | 2022-10-28 |
| 發明(設計)人: | 張華;李凱旋;王華偉;張欣;李文敏;高飛;溫巧燕 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F16/901;G06K9/62;G06N7/00 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 孫曉鳳 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 本地化 隱私 數據 發布 方法 相關 設備 | ||
1.一種基于本地化差分隱私的高維數據發布方法,包括:
接收待處理數據;其中,所述待處理數據是由用戶端對高維數據進行擾動后得到的,所述高維數據和所述待處理數據均包括多種屬性;
分別計算所述待處理數據中不同屬性的邊緣概率和聯合概率,包括:
(a)分別計算不同屬性的初始概率作為先驗概率,
(b)根據分別計算不同屬性的條件概率其中,Ωj為屬性Aj的值域,為字符串,i為用戶數,j為屬性數,wj為候選值,wj~N(0,I)表示wj服從標準正態分布,I表示標準差為1,N表示分布;
(c)枚舉不同屬性的組合并分別采用對應的所述條件概率計算所述聯合概率;
(d)根據貝葉斯定理計算出與所述先驗概率對應的后驗概率;
(e)響應于根據所述先驗概率和對應的所述后驗概率計算得到的相對熵為0,所述后驗概率即為不同屬性的邊緣概率;
響應于所述相對熵不為0,根據所述后驗概率的均值計算得到新的先驗概率;采用新的先驗概率進行新的條件概率、新的聯合概率和新的后驗概率的計算,并根據新的先驗概率和新的后驗概率計算新的相對熵;重復上述過程直到所述相對熵為0,并輸出這一輪計算中對應的所述邊緣概率和所述聯合概率;
根據所述邊緣概率和所述聯合概率計算不同所述屬性間的互信息,根據所述互信息構建馬爾可夫網,對所述馬爾可夫網進行三角化處理,并根據所述馬爾可夫網構建包括多個團的聯合樹;
分別計算每個所述團的分布,對所有所述團和對應的聯合分布進行連接操作,以合成高維數據集。
2.根據權利要求1所述的發布方法,其中,所述待處理數據是將采用隨機響應技術擾動所有字符串的結果聚合得到的;
所述字符串是所述用戶端對所述高維數據的每個所述屬性采用布隆過濾器轉化得到的。
3.根據權利要求2所述的發布方法,其中,若所述高維數據是連續型數據,所述待處理數據是通過將所述高維數據歸一化到[-1,1]區間,再對其進行擾動得到的;
所述接收待處理數據,具體包括:對所述待處理數據進行均值統計,以對其歸一化還原。
4.根據權利要求1所述的發布方法,其中,所述根據所述邊緣概率和所述聯合概率計算不同屬性的互信息,根據所述互信息構建馬爾可夫網,并根據所述馬爾可夫網構建包括多個團的聯合樹,包括:
分別計算兩個不同屬性間的互信息,
其中,i∈dom(am),j∈dom(an),dom(am),dom(an)分別表示所述屬性am和an的值域,Pr(am=i,an=j)表示am和an的所述聯合概率,與表示am和an的所述邊緣概率。
5.根據權利要求4所述的發布方法,其中,所述根據所述邊緣概率和所述聯合概率計算不同屬性的互信息,根據所述互信息構建馬爾可夫網,對所述馬爾可夫網進行三角化處理,并根據所述馬爾可夫網構建包括多個團的聯合樹,還包括:
對所述馬爾可夫網進行三角化,即對所述馬爾可夫網內所有長度大于3的環引入弦得到包含有多個所述團的完全團圖;
對所述完全團圖按照所述屬性的下標順序進行頂點消除,得到所述聯合樹;其中,所有所述團被包括在團集中。
6.根據權利要求5所述的發布方法,其中,所述分別計算每個所述團的分布,對所有所述團和對應的聯合分布進行迭代操作,以獲得高維數據集,包括:
采用計算所述邊緣概率和所述聯合概率的方法計算得到每個所述團、所述團之間的分割頂點的邊緣分布和每個所述團的聯合分布;
從所述團集隨機抽樣獲得所述團和對應的所述聯合分布,利用Merge-join對所有所述團進行所述迭代操作,得到所述高維數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110351651.5/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





