[發(fā)明專利]面向社交網(wǎng)絡(luò)的高可用性K-匿名數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110751023.6 | 申請日: | 2021-07-02 |
| 公開(公告)號: | CN113486396A | 公開(公告)日: | 2021-10-08 |
| 發(fā)明(設(shè)計)人: | 朱娜斐;王俊雯;何涇沙;王賀文;李越 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06K9/62 |
| 代理公司: | 北京匯信合知識產(chǎn)權(quán)代理有限公司 11335 | 代理人: | 王維新 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 社交 網(wǎng)絡(luò) 可用性 匿名 數(shù)據(jù)處理 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明公開了一種面向社交網(wǎng)絡(luò)的高可用性K?匿名數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì),屬于數(shù)據(jù)安全技術(shù)領(lǐng)域,包括基于社交網(wǎng)絡(luò),構(gòu)建社交網(wǎng)絡(luò)的無向圖,無向圖中每個節(jié)點對應(yīng)代表每個用戶,任意兩個節(jié)點間的連線代表對應(yīng)兩個用戶的結(jié)構(gòu)關(guān)系;對每個用戶進行相似性分析,獲取用戶之間的相似度值;根據(jù)用戶之間的相似度值對用戶進行聚類,獲得初始的聚類集合;K匿名形成超級節(jié)點;對超級節(jié)點匿名發(fā)布。本發(fā)明本發(fā)明通過相似度來將用戶進行聚類,且將聚集程度最大的節(jié)點來選擇初始種子節(jié)點,使得該方法的可用性有了明顯增強。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)安全技術(shù)領(lǐng)域,特別涉及一種面向社交網(wǎng)絡(luò)的高可用性K-匿名數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
目前K-匿名算法已經(jīng)在關(guān)系型數(shù)據(jù)上廣泛應(yīng)用,在社交網(wǎng)絡(luò)也有一定的應(yīng)用,但是社交網(wǎng)絡(luò)是一個錯綜復(fù)雜的網(wǎng)絡(luò),其中的節(jié)點,邊和節(jié)點之間的關(guān)系都包含了大量的隱私信息,傳統(tǒng)的K-匿名數(shù)據(jù)保護技術(shù)在社交網(wǎng)絡(luò)不太適用。存在以下一些不足之處:現(xiàn)在有信息保護算法考慮用戶信息不全面,在一定程度上對數(shù)據(jù)造成破壞或缺失;在選取K-匿名算法的初始節(jié)點時,沒有考慮到社交網(wǎng)絡(luò)的特性,隨機選取,導(dǎo)致數(shù)據(jù)信息損失嚴重;現(xiàn)有的信息保護算法沒有明確的考慮到用戶真實需要的信息保護力度,導(dǎo)致對于節(jié)點的保護失衡,使其數(shù)據(jù)有效性降低。
發(fā)明內(nèi)容
針對上述存在的問題,本發(fā)明提供一種面向社交網(wǎng)絡(luò)的高可用性K-匿名數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)。
一種面向社交網(wǎng)絡(luò)的高可用性K-匿名數(shù)據(jù)處理方法包括:
基于社交網(wǎng)絡(luò),構(gòu)建所述社交網(wǎng)絡(luò)的無向圖,所述無向圖中每個節(jié)點對應(yīng)代表每個用戶,任意兩個節(jié)點間的連線代表對應(yīng)兩個用戶的結(jié)構(gòu)關(guān)系;
對每個所述用戶進行相似性分析,獲取所述用戶之間的相似度值;
根據(jù)所述用戶之間的相似度值對所述用戶進行聚類,獲得初始的聚類集合;
K匿名形成超級節(jié)點;
對所述超級節(jié)點匿名發(fā)布;
其中,K匿名形成超級節(jié)點包括:
根據(jù)公式計算所述節(jié)點在所述無向圖中的聚集程度:
其中,k為所述節(jié)點vi的所有相鄰節(jié)點的個數(shù),n為所述節(jié)點vi的所有相鄰節(jié)點之間相互連接的邊的個數(shù);
選取聚集程度最大的節(jié)點位于的聚類集合,判斷所述聚類集合中的所述節(jié)點數(shù)量是否大于等于設(shè)定的隱私水平K;若符合,則所述聚集程度最大的節(jié)點為初始種子節(jié)點;若不符合,則選取與所述聚集程度最大的節(jié)點距離最大的節(jié)點位于的聚類集合進行判斷,依次類推,直至選到符合的初始種子節(jié)點;
計算所述初始種子節(jié)點和每個所述節(jié)點的距離,選擇最近的節(jié)點合并為超級節(jié)點;
重復(fù)合并為所述超級節(jié)點的過程,直至當(dāng)前所述超級節(jié)點包含的節(jié)點數(shù)量達到設(shè)定的隱私水平K;
去除所述超級節(jié)點包含的所有節(jié)點,重復(fù)生成超級節(jié)點直至剩余的節(jié)點數(shù)量小于設(shè)定的隱私水平K;
分別計算所述剩余的節(jié)點與之前生成的所述超級節(jié)點的距離,并逐個將所述剩余的節(jié)點分別合并到距離最小的所述超級節(jié)點中,直至所有的節(jié)點均聚類成所述超級節(jié)點。
優(yōu)選的是,對每個所述用戶進行相似性分析,獲取所述用戶之間的相似度值包括:
分別計算所述用戶的文本信息的相似度、結(jié)構(gòu)信息相似度以及屬性信息相似度;
并根據(jù)公式獲得所述用戶之間的相似度;
相似度值=a*文本信息相似度+b*結(jié)構(gòu)信息相似度+c*屬性信息相似度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110751023.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對象搜索方法及裝置
- 針對嵌入式應(yīng)用上下文中的搜索的查詢意圖表達
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲介質(zhì)
- 動態(tài)社交圈確定方法、裝置、設(shè)備及存儲介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計算機設(shè)備及存儲介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





