[發明專利]數據擾動方法、設備及存儲介質在審
| 申請號: | 202011060252.5 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112202542A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 王菊婷;陳偉堅;李想 | 申請(專利權)人: | 清華-伯克利深圳學院籌備辦公室 |
| 主分類號: | H04L9/00 | 分類號: | H04L9/00 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 劉方 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 擾動 方法 設備 存儲 介質 | ||
1.數據擾動方法,其特征在于,包括:
確定數據集的范圍,計算每個數據節點在所述數據集內的密度;
預設密度閾值,根據所述密度閾值和所述數據節點的密度進行劃分,以得到高密度節點和低密度節點;
將所述高密度節點采用均值替代方法進行計算,得到第一隨機擾動數據;
將所述低密度節點采用增強加法數據擾動方法進行計算,得到第二隨機擾動數據。
2.根據權利要求1所述的數據擾動方法,其特征在于,所述數據集的范圍采用K近鄰算法確定。
3.根據權利要求2所述的數據擾動方法,其特征在于,計算每個數據節點在所述數據集內的密度,具體包括:
計算所述數據集內任意兩個所述數據節點之間的拓撲勢;
計算該所述數據集的總拓撲勢;
將所述拓撲勢和所述總拓撲勢進行計算,得到所述數據節點的拓撲熵;
根據所述拓撲熵計算出所述數據節點的密度;
將集合內的所述數據節點重復上述步驟,得到集合內所有所述數據節點的密度。
4.根據權利要求3所述的數據擾動方法,其特征在于,所述計算所述數據集內任意兩個所述數據節點之間的拓撲勢,具體包括:
確定影響因子;
將所述影響因子、兩個所述數據節點之間的網絡距離進行計算,得到兩個所述數據節點之間的拓撲勢。
5.根據權利要求1至4任一項所述的數據擾動方法,其特征在于,所述密度閾值通過人工設置、集合內所有所述數據節點的密度均值以及分位數中的任意一種確定。
6.根據權利要求4所述的數據擾動方法,其特征在于,所述確定影響因子具體包括:
預設影響范圍閾值,根據所述影響范圍閾值確定影響因子。
7.根據權利要求2所述的數據擾動方法,其特征在于,所述均值替代方法具體包括:
所述數據節點的值通過所述K近鄰內所述數據節點的均值進行替換。
8.根據權利要求1至4任一項所述的數據擾動方法,其特征在于,所述增強加法數據擾動方法,具體包括:
采用正態分布生成隨機擾動;
根據所述低密度節點的宏觀統計性質特征、秘密特征以及非秘密特征之間的關系計算正態分布相關的參數項;
采用加法結構將所述低密度節點與所述參數項疊加,以得到第二隨機擾動數據。
9.一種數據擾動設備,其特征在于,包括:
至少一個處理器,以及,
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如權利要求1至8任一項所述的數據擾動方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機可執行指令,所述計算機可執行指令用于使計算機執行如權利要求1至8任一項所述的數據擾動方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華-伯克利深圳學院籌備辦公室,未經清華-伯克利深圳學院籌備辦公室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011060252.5/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





