[發明專利]一種基于多身份空間映射的關系網絡構建方法有效
| 申請號: | 201910119063.1 | 申請日: | 2019-02-18 |
| 公開(公告)號: | CN109885797B | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 胡瑞敏;朱玟謙;詹澤行;李登實;黃文心;王中元;王曉晨 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/2458 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 身份 空間 映射 關系 網絡 構建 方法 | ||
本發明公開了一種基于多身份空間映射的關系網絡構建方法,利用個體身份相關數據將個體映射至多元身份空間,然后根據不同屬性維度組合具備不同的身份辨識粒度和社會語義區分度,選取高辨識粒度和高社會語義區分度的屬性組合作為個體的聚類維度,將用戶在這些屬性空間中進行聚類處理,最后通過個體間共現的頻度來判定個體間是否存在關系,進而實現關系網絡的構建。本發明具有高效、準確、去參數化等特點,可應用于推薦系統,網絡安全等領域。
技術領域
本發明屬于數據挖掘技術領域,涉及一種基于多身份空間映射的關系網絡構建方法,適用于復雜身份環境下的關系挖掘與關系網絡構建。
背景技術
隨著網絡科學(Network Science)的快速發展及相關理論的廣泛應用,大多數復雜系統如通信網絡系統,社會交際系統,跨國公司組織系統等能夠以網絡的形式進行高效表達,借助網絡分析方法,更好的實現了復雜系統中深層規律與演化特征的挖掘,這是傳統數據挖掘方法難以企及的,網絡科學也因此成為一直被高度關注和研究的熱點學科。網絡的構建是網絡科學的研究的基礎,如何將原始數據準確高效的構建成網絡,是網絡分析開展的重要前提和基礎,是網絡科學中的重要基礎問題。
傳統的網絡構建方法是根據節點間直接存在的“關系”進行構建的,如線上社交平臺中,以用戶為節點,用戶間的好友關系為連邊則可構建出線上社交網絡,互聯網空間中,以網站為節點,網站間的鏈接關系為連邊則可構建出線上網站鏈接網絡。但現實應用環境中,往往只能獲取到節點的個體信息,節點間的關系信息難以獲取,針對此類情況,傳統的數據挖掘方法如K-means算法,層次聚類算法無法完成實現高精準度和細粒度的深層關系挖掘,為此需要設計一種關系挖掘方法將蘊含在節點個體信息中的關系信息映射至網絡拓撲空間。
發明內容
本發明的目的是提供一種基于節點個體身份信息實現節點間潛在關系挖掘的技術方案,該發明能夠準確且高效的實現節點間深層次的關系挖掘。
本發明所采用的技術方案是:一種基于多身份空間映射的關系網絡構建方法,其特征在于,包括以下步驟:
步驟1:獲取節點身份相關屬性向量,記為Ii={Ari1,Ari2,…,Arin},其中Ii表示第i個節點,Arij表示Ii第j個身份屬性的屬性值,其中身份屬性包含職業,收入,工作地點等具有個體辨識性的屬性;
步驟2:定義節點身份核心標識集;
在節點身份空間中,稱屬性集合M為節點a的身份核心標識集,如果M滿足:
1)M能夠唯一識別出節點a;
2)M的任何真子集都無法唯一識別出節點a;
節點的身份核心標識集不唯一,節點可以不具備核心標識集,也可具備多個核心標識集;定義由兩個或兩個以上身份屬性組成的核心標識集為群體性核心標識集;
步驟3:對屬性集合{Ari}進行全排列,根據排列路徑計算每個節點的核心標識集;
步驟4:根據步驟2,挑選出每由兩個或兩個以上屬性組成的身份核心標識集作為節點的群體性核心標識集,記為{Agroupi}j,{Agroupi}j表示第j個節點的第i個群體性核心標識集序號;任意節點對之間進行對應{Agroupi}j的交集運算,得到具有群體劃分性的屬性組合Bgroup;
Bgroup在群體性核心標識集中出現的頻度計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910119063.1/2.html,轉載請聲明來源鉆瓜專利網。





