[發明專利]一種基于多身份空間映射的關系網絡構建方法有效
| 申請號: | 201910119063.1 | 申請日: | 2019-02-18 |
| 公開(公告)號: | CN109885797B | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 胡瑞敏;朱玟謙;詹澤行;李登實;黃文心;王中元;王曉晨 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/2458 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 身份 空間 映射 關系 網絡 構建 方法 | ||
1.一種基于多身份空間映射的關系網絡構建方法,其特征在于,包括以下步驟:
步驟1:獲取節點身份相關屬性向量,記為Ii={Ari1,Ari2,…,Arin},其中Ii表示第i個節點,Arij表示Ii第j個身份屬性的屬性值,其中身份屬性包含具有個體辨識性的屬性;
步驟2:定義節點身份核心標識集;
在節點身份空間中,稱屬性集合M為節點a的身份核心標識集,如果M滿足:
1)M能夠唯一識別出節點a;
2)M的任何真子集都無法唯一識別出節點a;
節點的身份核心標識集不唯一,節點可以不具備核心標識集,也可具備多個核心標識集;定義由兩個或兩個以上身份屬性組成的核心標識集為群體性核心標識集;
步驟3:對屬性集合{Ari}進行全排列,根據排列路徑計算每個節點的核心標識集;
步驟4:根據步驟2,挑選出每由兩個或兩個以上屬性組成的身份核心標識集作為節點的群體性核心標識集,記為{Agroupi}j,{Agroupi}j表示第j個節點的第i個群體性核心標識集序號;任意節點對之間進行對應{Agroupi}j的交集運算,得到具有群體劃分性的屬性組合Bgroup;
Bgroup在群體性核心標識集中出現的頻度計算公式為:
步驟5:按照頻度順序排序Bgroup,選取大于閾值Θ的Bgroup作為下一步的聚類的維度標準,由此得到具有群體劃分性的屬性組集合{Bgroupi};
步驟6:對于集合{Bgroupi}任一元素Bgroupj,提取出節點在Bgroupj屬性維度下的屬性數據,構成身份向量,對身份向量進行聚類處理,得到K個聚類結果,其中K是{Bgroupi}中元素的個數;
步驟7:統計節點的聚類結果,根據每個節點與其他節點出現在不同分類結果中的次數,計算出關注節點i與任一節點j之間的聯系強度cor(i,j),
其中,co(k,i,l)表示節點i與節點l在第k個聚類結果中是否屬于同一類,如果是則值為1,否則為0;
步驟8:判斷節點間關聯強弱,聯系強度cor(i,j)大于閾值Δ的節點之間存在聯系,節點之間存在連邊,進而構建出節點集合的關系網絡,實現了節點可信內在關系的挖掘。
2.根據權利要求1所述的基于多身份空間映射的關系網絡構建方法,其特征在于,步驟3中所述計算每個節點的核心標識集,具體實現過程是:對于每個屬性組合路徑Ar1→Ar2→…→Arn,按照屬性Ar1對節點集合進行分類,劃分后如果有單個節點類組的存在,則這些節點的標識集記為Ar1,去除這些節點,在Ar1分類結果的基礎上按Ar2對節點進行分類,分類后單個節點類組的節點標識集記為Ar1+Ar2,去除這些節點;重復上述步驟直至到屬性Arn或所有的節點都被去除,即得到每個節點的標識集;判斷每個節點的標識集是否具有包含關系,包含關系中最小的集合及不具有包含關系的集合作為節點的身份核心標識集。
3.根據權利要求1所述的基于多身份空間映射的關系網絡構建方法,其特征在于:步驟6中,用基于密度的聚類算法DBSCAN對身份向量進行聚類處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910119063.1/1.html,轉載請聲明來源鉆瓜專利網。





