[發明專利]基于多重鄰居節點的多重語義影響的網絡鏈接預測方法有效
| 申請號: | 201910985752.0 | 申請日: | 2019-10-17 |
| 公開(公告)號: | CN110851491B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 王博;宋美賢;胡清華 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/28;G06F40/30;G06N3/0464;G06N3/047;G06N3/048;G06N3/08;G06Q50/00 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 曹玉平 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多重 鄰居 節點 語義 影響 網絡 鏈接 預測 方法 | ||
1.一種基于多重鄰居節點的多重語義影響的網絡鏈接預測方法,其特征在于,包括以下步驟:
步驟一,數據解析,用于解析社交網絡中節點行為數據以及節點間關系數據;分別從節點的興趣屬性、以及節點好友屬性中解析出相關屬性向量;獲得節點興趣特征、網絡結構特征;
步驟二,模型訓練,用于構建獲取社交網絡中節點嵌入向量的模型;基于數據解析模塊獲得的節點興趣特征、網絡結構特征,模型建模多重鄰居節點的多重語義影響,獲取得到每個節點的嵌入向量;
步驟三,預測分析,使用節點對的嵌入向量之間的相似性來測量相應節點對之間存在好友鏈接的概率;
步驟二中,訓練目標是獲得網絡嵌入矩陣V=[v1,v2,...,vn],V由所有節點的嵌入向量組合形成,其中是節點ui的嵌入向量;為了訓練網絡中每個節點的嵌入向量,最大化所有已知邊的概率之和,如下所示:
其中,E是社交網絡中的好友鏈接集合,即邊集合;L(e)是基于拓撲的目標函數LT(e)和基于影響的目標函數LI(e)的權衡,基于拓撲和基于影響的嵌入向量被映射到相同的表示空間中;
L(e)=αLT(e)+(1-α)LI(e)
其中基于拓撲的目標函數基于影響的目標函數wij是社交網絡中的邊的權重,用于表示好友關系的強度或極性,以適用于各種網絡;
在模型訓練過程中獲得節點的基于影響的嵌入向量時,該節點的每個鄰居的語義影響用每個鄰居和該節點的興趣文本的語義建模;該語義影響分別在局部和全局層面建模,并合并為一個聯合的基于影響的嵌入向量;其中,局部級語義影響用于捕獲局部區域的文本語義影響,局部區域的文本用興趣文本中的某些術語詞匯來解釋;全局級語義影響捕捉鄰居的全局興趣語義所造成的影響,即興趣文本整體語義所刻畫的全局語義而造成的語義影響;
把所有鄰居對節點ui的基于影響的嵌入向量進行平均,來生成最終的如下所示:
其中m表示節點ui的鄰居節點數量,表示鄰居節點uk對節點ui的基于影響的嵌入向量;通過連接局部級語義影響嵌入和全局級語義影響嵌入獲得鄰居節點uk對節點ui的基于影響的嵌入向量,即:其中且
基于局部級語義影響的嵌入向量訓練是基于卷積神經網絡和注意力機制;訓練包括:獲取一對好友節點ui,uk的詞序列Si,Sk,基于查找層,卷積層,注意層和輸出層獲得最終的基于局部級語義影響的嵌入向量;
基于詞序列Si,通過查找層獲得文本嵌入矩陣X=[x1,x2,...,x0],然后基于如下卷積公式,獲得局部特征矩陣C(i)=[c1,c2,...,cn-h+1];
ci=f(Wcxi:i+h-1+b)
以同樣的方式,獲取節點uk的局部特征矩陣C(k),
結合注意力機制,耦合一組好友節點的局部語義相關性,并為兩個局部特征矩陣各生成一個注意力向量,使得來自鄰居節點的局部語義信息直接影響該節點的嵌入向量;生成注意力向量時,首先使用局部特征矩陣C(i),C(k)構建用于局部級語義影響的語義匹配矩陣M,其目標是獲取語義匹配信號,計算方式如下:
其中,語義匹配矩陣Mxy表示矩陣M的第x行、第y列元素;對語義匹配矩陣M進行均值池化和softmax運算,以生成注意力向量,計算方式如下:
a(i)=softmax(meanrow(M))
a(k)=softmax(meancol(M))
其中,a(i),分別是局部特征矩陣C(i),C(k)的注意力向量,meanrow(·)和meancol(·)分別表示對矩陣在行、列方向上進行均值池化;
節點uk對節點ui的基于局部級語義影響的嵌入向量計算如下:
以同樣的方式,計算節點ui對節點uk的基于局部級語義影響的嵌入向量
基于全局級語義影響的嵌入向量訓練是利用Bi-GRU模型獲取全局語義影響,包括:
給定節點ui,先獲得節點ui對應的文本嵌入矩陣X,GRU模型的第t個隱藏狀態組件的計算方式如下:
rt=σ(Wxrxt+Whrht-1)
zt=σ(Wxzxt+Whzht-1)
獲取節點ui的前向隱藏狀態和后向隱藏狀態并將和連接后得到Bi-GRU模型的隱藏狀態
對所有歷史隱藏狀態應用均值池化,即:
將向量的大小映射到相應的維度,如下:
其中,矩陣是投影矩陣;向量是節點uk對節點ui的基于全局級語義影響的嵌入向量;以同樣的方式,計算節點ui對節點uk的基于全局級語義影響的嵌入向量
對于訓練網絡中每個節點的嵌入向量進行模型優化,包括:
采用負采樣算法對原目標函數進行加速,即為每個已知邊(ui,uk)指定以下目標函數:
其中,K表示對應的負采樣邊的個數;σ(·)表示sigmoid函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910985752.0/1.html,轉載請聲明來源鉆瓜專利網。





