[發(fā)明專利]基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法及裝置在審
| 申請?zhí)枺?/td> | 202210865150.3 | 申請日: | 2022-07-22 |
| 公開(公告)號: | CN115082720A | 公開(公告)日: | 2022-09-20 |
| 發(fā)明(設(shè)計(jì))人: | 褚紅亮;余騰龍;彭謙;黃康;胡兵;胡瀟;王璠 | 申請(專利權(quán))人: | 國網(wǎng)江西省電力有限公司信息通信分公司 |
| 主分類號: | G06V10/762 | 分類號: | G06V10/762;G06V10/28;G06F21/62 |
| 代理公司: | 北京眾合誠成知識產(chǎn)權(quán)代理有限公司 11246 | 代理人: | 王煥巧 |
| 地址: | 330000 江西省南昌市青*** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 離群 檢測 隱私 直方圖 發(fā)布 方法 裝置 | ||
1.一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,包括以下步驟:
S1,對原始直方圖數(shù)據(jù)進(jìn)行噪聲擾動后得到初始差分隱私直方圖;
S2,對初始差分隱私直方圖離群點(diǎn)檢測后得到離群點(diǎn)分組集合,并將離群點(diǎn)從初始差分隱私直方圖中剔除;
S3,對剔除離群點(diǎn)的差分隱私直方圖進(jìn)行K-means聚類得到K-means聚類分組集合;
S4,將離群點(diǎn)分組集合和K-means聚類分組集合合并后進(jìn)行閾值處理后得到最終發(fā)布的差分隱私直方圖。
2.根據(jù)權(quán)利要求1所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,S1中,對原始直方圖添加大小為的Laplace噪聲,形成初始差分隱私直方圖,其中:表示原始直方圖中的桶;表示含噪聲的桶;為直方圖中桶的總數(shù),并且原始直方圖與初始差分隱私直方圖桶總數(shù)相同。
3.根據(jù)權(quán)利要求2所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,S2中,利用LOF離群點(diǎn)檢測算法對初始差分隱私直方圖進(jìn)行離群點(diǎn)檢測,計(jì)算出每個(gè)數(shù)據(jù)的局部離群因子,將局部離群因子大于1的數(shù)據(jù)標(biāo)記為一個(gè)單獨(dú)的分組,并入到離群點(diǎn)分組集合中,通過對初始差分隱私直方圖進(jìn)行離群點(diǎn)檢測,得到離群點(diǎn)分組集合,同時(shí)將檢測出的離群點(diǎn)從初始差分隱私直方圖中剔除,其中:表示離群點(diǎn)分組集合中的分組,并且這些分組由單個(gè)離群點(diǎn)桶組成;表示離群點(diǎn)分組數(shù)。
4.根據(jù)權(quán)利要求3所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,離群點(diǎn)分組集合生成包括:
S2.1計(jì)算初始差分隱私直方圖中單個(gè)桶的第距離鄰域內(nèi)的第可達(dá)距離:
其中,為鄰域點(diǎn)到第可達(dá)距離,為鄰域點(diǎn)到的真實(shí)距離;
S2.2計(jì)算的局部可達(dá)密度:
其中,為點(diǎn)的第距離鄰域;
S2.3計(jì)算的第局部離群因子:
其中,為鄰域點(diǎn)的局部可達(dá)密度;
S2.4將局部離群因子大于1的每個(gè)桶視為一個(gè)單獨(dú)的分組,劃分到離群點(diǎn)分組中得到離群點(diǎn)分組集合;
S2.5 將檢測到的離群點(diǎn)從初始差分隱私直方圖中剔除。
5.根據(jù)權(quán)利要求4所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,S3中,對剔除離群點(diǎn)的差分隱私直方圖利用K-means進(jìn)行最優(yōu)聚類劃分,得到K-means聚類分組集合,具體包括
S3.1 設(shè)置個(gè)聚類中心數(shù),;
S3.2在剔除離群點(diǎn)的差分隱私直方圖數(shù)據(jù)中隨機(jī)選取個(gè)點(diǎn)得到中心點(diǎn)集合,其中:表示集合中的所有中心點(diǎn),表示第個(gè)中心點(diǎn);
S3.3 利用得到的中心點(diǎn)集合對剔除離群點(diǎn)的差分隱私直方圖數(shù)據(jù)進(jìn)行K-means聚類分組,得到K-means聚類分組集合。
6.根據(jù)權(quán)利要求5所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,S4中,將離群點(diǎn)分組集合與K-means聚類分組集合進(jìn)行合并,得到最終分組集合;其中,最終分組數(shù)為。
7.根據(jù)權(quán)利要求6所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,將最終分組集合求取均值得到均值分組集合;
設(shè)置閾值,將中小于的數(shù)據(jù)作0處理。
8.根據(jù)權(quán)利要求7所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,閾值處理中,,,是一個(gè)調(diào)節(jié)參數(shù),為直方圖中桶的總數(shù)。
9.根據(jù)權(quán)利要求1所述的一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布方法,其特征在于,閾值處理后恢復(fù)原始直方圖順序得到降噪后的差分隱私直方圖,即為最終發(fā)布的差分隱私直方圖;
其中:表示降噪直方圖的桶;為直方圖中桶的總數(shù)。
10.一種基于離群點(diǎn)檢測的差分隱私直方圖發(fā)布裝置, 其特征在于,包括:
第一模塊:被配置為對原始直方圖數(shù)據(jù)進(jìn)行噪聲擾動后得到初始差分隱私直方圖;
第二模塊:被配置為對初始差分隱私直方圖離群點(diǎn)檢測后得到離群點(diǎn)分組集合,并將離群點(diǎn)從初始差分隱私直方圖中剔除;
第三模塊:被配置為對剔除離群點(diǎn)的差分隱私直方圖進(jìn)行K-means聚類得到K-means聚類分組集合;
第四模塊:被配置為將離群點(diǎn)分組集合和K-means聚類分組集合合并后進(jìn)行閾值處理后得到最終發(fā)布的差分隱私直方圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)江西省電力有限公司信息通信分公司,未經(jīng)國網(wǎng)江西省電力有限公司信息通信分公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210865150.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種識別離群交通數(shù)據(jù)的方法
- 一種大規(guī)模數(shù)據(jù)中離群數(shù)據(jù)的分析方法
- 一種基于角度的高維數(shù)據(jù)離群檢測方法
- 離群點(diǎn)檢測方法和裝置
- 一種去趨勢分析差分隱私保護(hù)的直方圖數(shù)據(jù)發(fā)布方法
- 異常數(shù)據(jù)檢測方法及裝置
- 將未經(jīng)監(jiān)督參數(shù)學(xué)習(xí)用于離群值檢測以識別生產(chǎn)用生物體
- 動力系統(tǒng)運(yùn)行異常點(diǎn)檢測方法
- 基于離群參數(shù)的設(shè)備故障預(yù)警方法、裝置、設(shè)備及介質(zhì)
- 眼動數(shù)據(jù)的離群處理方法及裝置、計(jì)算機(jī)設(shè)備、存儲介質(zhì)





