[發明專利]面向社交網絡的高可用性K-匿名數據處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110751023.6 | 申請日: | 2021-07-02 |
| 公開(公告)號: | CN113486396A | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 朱娜斐;王俊雯;何涇沙;王賀文;李越 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06K9/62 |
| 代理公司: | 北京匯信合知識產權代理有限公司 11335 | 代理人: | 王維新 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 社交 網絡 可用性 匿名 數據處理 方法 裝置 電子設備 存儲 介質 | ||
1.一種面向社交網絡的高可用性K-匿名數據處理方法,其特征在于,包括:
基于社交網絡,構建所述社交網絡的無向圖,所述無向圖中每個節點對應代表每個用戶,任意兩個節點間的連線代表對應兩個用戶的結構關系;
對每個所述用戶進行相似性分析,獲取所述用戶之間的相似度值;
根據所述用戶之間的相似度值對所述用戶進行聚類,獲得初始的聚類集合;
K匿名形成超級節點;
對所述超級節點匿名發布;
其中,K匿名形成超級節點包括:
根據公式計算所述節點在所述無向圖中的聚集程度:
其中,k為所述節點vi的所有相鄰節點的個數,n為所述節點vi的所有相鄰節點之間相互連接的邊的個數;
選取聚集程度最大的節點位于的聚類集合,判斷所述聚類集合中的所述節點數量是否大于等于設定的隱私水平K;若符合,則所述聚集程度最大的節點為初始種子節點;若不符合,則選取與所述聚集程度最大的節點距離最大的節點位于的聚類集合進行判斷,依次類推,直至選到符合的初始種子節點;
計算所述初始種子節點和每個所述節點的距離,選擇最近的節點合并為超級節點;
重復合并為所述超級節點的過程,直至當前所述超級節點包含的節點數量達到設定的隱私水平K;
去除所述超級節點包含的所有節點,重復生成超級節點直至剩余的節點數量小于設定的隱私水平K;
分別計算所述剩余的節點與之前生成的所述超級節點的距離,并逐個將所述剩余的節點分別合并到距離最小的所述超級節點中,直至所有的節點均聚類成所述超級節點。
2.如權利要求1所述的面向社交網絡的高可用性K-匿名數據處理方法,其特征在于,對每個所述用戶進行相似性分析,獲取所述用戶之間的相似度值包括:
分別計算所述用戶的文本信息的相似度、結構信息相似度以及屬性信息相似度;
并根據公式獲得所述用戶之間的相似度;
相似度值=a*文本信息相似度+b*結構信息相似度+c*屬性信息相似度;
其中,a、b、c為常數,且a+b+c=1。
3.如權利要求2所述的面向社交網絡的高可用性K-匿名數據處理方法,其特征在于,分別計算所述用戶的文本信息的相似度、結構信息相似度以及屬性信息相似度:
初始化所述用戶的文本信息,并將所述文本信息轉換成向量存放;
根據余弦相似度來計算所述用戶的文本信息的相似度;
所述用戶之間含有的公共節點與所述用戶之間鄰居節點和的比值為所述用戶的結構信息相似度;
所述用戶的屬性信息包括數值數據和非數值數據,所述數值數據的相似度為所述用戶之間差值的絕對值;所述非數值數據的相似度為所述用戶之間到所述用戶之間的公共節點的最短距離。
4.如權利要求1所述的面向社交網絡的高可用性K-匿名數據處理方法,其特征在于,計算所述初始種子節點和每個所述節點的距離,選擇最近的節點合并為超級節點包括:
當有多個所述節點與所述初始種子節點的距離最小且相同時,則優先選擇與所述初始種子節點為同一個聚類集合的候選節點合并為超級節點;如果候選節點中沒有與所述初始種子節點為同一個聚類集合的節點時,則優先選擇單節點合并為超級節點。
5.如權利要求1所述的面向社交網絡的高可用性K-匿名數據處理方法,其特征在于,設定的隱私水平K的取值范圍為1<K≤n,其中n是用戶數量。
6.如權利要求1所述的面向社交網絡的高可用性K-匿名數據處理方法,其特征在于,分別計算所述剩余的節點與之前生成的所述超級節點的距離,并逐個將所述剩余的節點分別合并到距離最小的所述超級節點中,直至所有的節點均聚類成所述超級節點包括:
當所述剩余的節點與多個所述超級節點的距離最小且相同時,則將當前所述剩余的節點合并到所述初始種子節點與之為同一個聚類集合的超級節點中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110751023.6/1.html,轉載請聲明來源鉆瓜專利網。





