[發明專利]基于匹配用戶最優擴展的跨網絡用戶識別方法在審
| 申請號: | 201910922938.1 | 申請日: | 2019-09-27 |
| 公開(公告)號: | CN110708191A | 公開(公告)日: | 2020-01-17 |
| 發明(設計)人: | 申德榮;李想;馮朔;寇月;聶鐵錚;于戈 | 申請(專利權)人: | 東北大學 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/58 |
| 代理公司: | 21109 沈陽東大知識產權代理有限公司 | 代理人: | 李在川 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 匹配用戶 集合 局部擴展 最優匹配 互聯網技術 迭代終止 目的網絡 匹配結果 用戶更新 用戶集合 用戶識別 鄰居 跨網絡 冷啟動 向量化 源網絡 準確率 迭代 匹配 全局 更新 改進 網絡 | ||
1.一種基于匹配用戶最優擴展的跨網絡用戶識別方法,其特征在于:包括以下步驟:
步驟1:全局已知匹配用戶的擴充;獲取兩個網絡間已知的少量已匹配用戶,形成已匹配用戶集合A,對兩個網絡中的其他用戶到已匹配用戶的距離進行向量化表示;在兩個網絡中,分別將向量中p_count值大于閾值k的用戶作為候選匹配用戶進行匹配,將大于閾值k的候選匹配用戶添加到已匹配用戶的集合中,完成全局已匹配用戶的擴充,其中p_count表示用戶的信息豐富程度;
步驟2:基于已匹配用戶最優局部擴展階段;將兩個網絡中信息豐富的用戶匹配后,根據得到的已匹配用戶集合A',找到源網絡中所有已匹配用戶的鄰居,在目的網絡的未匹配用戶內找到每個鄰居的最優匹配用戶,完成一次迭代匹配;將匹配出的用戶更新到集合A'中,直至沒有新的匹配用戶迭代終止,得到最優匹配用戶集合A;
步驟2.1:基于共同鄰居進行相似分數計算,共同鄰居相似度分數公式如下:
表示用戶和用戶的共同鄰居的個數,表示用戶和用戶鄰居個數的最大值;代表源網絡Gs中未匹配用戶,代表目的網絡Gt中未匹配用戶;
步驟2.2:最優局部擴展;在找源網絡中已匹配用戶的鄰居在目的網絡中的最優匹配用戶時,首先進行第一層擴展,將目的網絡中已匹配用戶作為全局最優用戶,將全局最優用戶的全部鄰居作為候選匹配用戶根據共同鄰居計算相似度,選取分數最高的用戶為二代全局最優用戶;然后進行第二層擴展,將二代全局最優用戶的所有鄰居作為候選匹配用戶計算相似度,將上一次擴展的非全局最優用戶選取一個鄰居作為候選匹配用戶計算相似度,選取的鄰居為在上一次擴展的非全局最優用戶中相似度分數最高的用戶;在擴展的過程中,若此次擴展中的候選匹配用戶的相似度小于上一層的鄰居用戶的分數,則該分支就不在進行擴展,若此次擴展中的候選匹配用戶的相似度大于等于上一層的鄰居用戶的分數,則繼續進行擴展,當全局最優匹配用戶不變時,匹配過程結束;其中
步驟2.3:重復步驟2.1-步驟2.2,直到匹配用戶的集合不再更新,結束此次跨網絡用戶識別。
2.根據權利要求1所述的一種基于匹配用戶最優擴展的跨網絡用戶識別方法,其特征在于:所述步驟1的具體步驟如下:
步驟1.1:獲取已匹配用戶集合A,基于已匹配用戶對用戶進行向量化表示;將G=(V,E)來表示社交網絡,其中V代表用戶集合,E代表用戶之間的關系集合;若源網絡Gs中的用戶和目的網絡Gt中的用戶是已匹配用戶則表示為其中為源網絡Gs中已匹配的用戶,為目的網絡Gt中已匹配的用戶,aij∈A;將已知匹配用戶作為參照點,求出兩個網絡中的未匹配用戶到所有已匹配用戶的距離進行向量化表示,得到源網絡向量化集合和目的網絡向量化集合
兩個網絡中未匹配用戶到所有已匹配用戶的距離進行向量化表示,公式如下:
其中,代表將源網絡Gs中用戶到所有已匹配用戶的距離進行向量化表示,代表將目的網絡Gt中用戶到所有已匹配用戶的距離進行向量化表示;代表源網絡Gs中第m個未匹配用戶,代表目的網絡Gt中第n個未匹配用戶;
用戶向量化過程是將已匹配用戶為根進行逐層遍歷,當遍歷到了其他已匹配用戶時,將兩個已匹配用戶之間的路徑上經過的用戶的信息豐富度的值加1;由p_count表示該用戶的信息豐富程度;
步驟1.2:候選匹配用戶的選取;在兩個網絡中,選取含有豐富信息的用戶作為候選匹配用戶,定義p_count值大于閾值k的用戶為含有豐富信息的用戶;
步驟1.3:候選匹配用戶的相似度計算;采用余弦公式來計算用戶之間的相似度,公式如下:
其中,和分別為代表不同社交網絡上的兩個用戶,其中m∈M,n∈N;
將相似度大于閾值t的兩個用戶作為已匹配用戶加入到已匹配用戶集合,得到已匹配用戶集合A';達到擴充已匹配用戶數量的目的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910922938.1/1.html,轉載請聲明來源鉆瓜專利網。





