[發明專利]基于離群點檢測的差分隱私直方圖發布方法及裝置在審
| 申請號: | 202210865150.3 | 申請日: | 2022-07-22 |
| 公開(公告)號: | CN115082720A | 公開(公告)日: | 2022-09-20 |
| 發明(設計)人: | 褚紅亮;余騰龍;彭謙;黃康;胡兵;胡瀟;王璠 | 申請(專利權)人: | 國網江西省電力有限公司信息通信分公司 |
| 主分類號: | G06V10/762 | 分類號: | G06V10/762;G06V10/28;G06F21/62 |
| 代理公司: | 北京眾合誠成知識產權代理有限公司 11246 | 代理人: | 王煥巧 |
| 地址: | 330000 江西省南昌市青*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 離群 檢測 隱私 直方圖 發布 方法 裝置 | ||
本發明涉及一種基于離群點檢測的差分隱私直方圖發布方法及裝置,屬于直方圖數據發布領域,與現有技術相比解決了直方圖數據發布中離群點過多導致分組劃分不準確,進而導致發布數據誤差較大的問題。本發明包括以下步驟:噪聲擾動;離群點分組集合生成;K?means聚類分組集合生成;對離群點分組集合和K?means聚類分組集合進行分組合并;對合并后的分組集合求取均值;閾值處理;最后,恢復直方圖順序并得到待發布的差分隱私直方圖。本發明能夠有效地對直方圖進行合理劃分,降低了發布數據的誤差,在滿足差分隱私的前提下,提升了數據的可用性。
技術領域
本發明涉及直方圖數據發布領域,具體來說是一種基于離群點檢測的差分隱私直方圖發布方法及裝置。
背景技術
隨著大數據時代的到來,社會每時每刻都在產生著大量的信息。在此基礎上,產生了越來越多新興的工作,例如大數據分析、數據挖掘、人工智能等。研究者通過對數據進行分析、挖掘從中獲取有價值的信息。因此,為了更便捷的獲取數據,最常用的方法是將數據在網絡上進行公布,但這一行為會造成巨大的風險。例如,黑客竊取數據中用戶的隱私信息,進行非法活動。因此,如何保護發布數據的隱私成為了數據隱私保護領域的研究重點。
現有的隱私保護方法有k-匿名、t-closeness等。但這些方法存在著一個很大的問題。無法抵御攻擊者發動的最大背景知識攻擊。并且其攻擊假設并不合理,缺乏嚴格的邏輯證明。因此,差分隱私成為了當前隱私保護領域的主流技術,差分隱私通過對數據進行去隱私化處理,能夠有效的防御最大背景知識攻擊。
現有直方圖數據發布通常采用分組優化的方式對直方圖進行降噪處理,以達到降低發布數據誤差的目的。但現有方法在分組聚類過程中并沒有考慮離群點的問題,若離群點被劃分到分組中,則會產生較大分組誤差。因此需要一種針對離群點的差分隱私直方圖發布算法,提升聚類分組的準確性,在滿足差分隱私的前提下,提升發布數據的可用性。
發明內容
本發明的目的是為了解決直方圖數據發布中離群點劃分以及數據可用性的問題。提供了一種基于離群點檢測的差分隱私直方圖發布方法及裝置??梢栽诒WC差分隱私的前提下,提升發布數據的可用性。
本發明的技術方案如下:
本發明提供一種基于離群點檢測的差分隱私直方圖發布方法,包括以下步驟:
S1,對原始直方圖數據進行噪聲擾動后得到初始差分隱私直方圖;
S2,對初始差分隱私直方圖離群點檢測后得到離群點分組集合,并將離群點從初始差分隱私直方圖中剔除;
S3,對剔除離群點的差分隱私直方圖進行K-means聚類得到K-means聚類分組集合;
S4,將離群點分組集合和K-means聚類分組集合合并后進行閾值處理后得到最終發布的差分隱私直方圖。
在S1中,對原始直方圖添加大小為的Laplace噪聲,形成初始差分隱私直方圖,其中:表示原始直方圖中的桶;表示含噪聲的桶;為直方圖中桶的總數,并且原始直方圖與初始差分隱私直方圖桶總數相同。
在S2中,利用LOF離群點檢測算法對初始差分隱私直方圖進行離群點檢測,計算出每個數據的局部離群因子,將局部離群因子大于1的數據標記為一個單獨的分組,并入到離群點分組集合中,通過對初始差分隱私直方圖進行離群點檢測,得到離群點分組集合,同時將檢測出的離群點從初始差分隱私直方圖中剔除,其中:表示離群點分組集合中的分組,并且這些分組由單個離群點桶組成;表示離群點分組數。
離群點分組集合生成包括:
S2.1計算初始差分隱私直方圖中單個桶的第距離鄰域內的第可達距離:
其中,為鄰域點到第可達距離,為鄰域點到的真實距離;
S2.2計算的局部可達密度:
其中,為點的第距離鄰域;
S2.3計算的第局部離群因子:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網江西省電力有限公司信息通信分公司,未經國網江西省電力有限公司信息通信分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210865150.3/2.html,轉載請聲明來源鉆瓜專利網。





