[發明專利]一種基于網絡結構和文本信息的鏈路預測方法有效
| 申請號: | 202010113634.3 | 申請日: | 2020-02-24 |
| 公開(公告)號: | CN111368074B | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 易運暉;郭泰吉;趙楠;陳南;權東曉;何先燈;程相澤 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/36;G06F16/9536;G06Q50/00;G06N3/04 |
| 代理公司: | 西安銘澤知識產權代理事務所(普通合伙) 61223 | 代理人: | 梁靜 |
| 地址: | 710071 陜西省西安市*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡 結構 文本 信息 預測 方法 | ||
1.一種基于網絡結構和文本信息的鏈路預測方法,包括以下步驟:
S1、基于網絡結構中隨機游走的節點,獲得節點的結構嵌入向量;
S11、對于網絡結構中的任一節點,采取寬度優先搜索和深度優先搜索兩種隨機游走搜索方式來獲取該節點的一階鄰居節點集合;
S12、根據一階鄰居節點的隨機游走,得到該節點的二階鄰居節點集合;
S13、對一階和二階鄰居節點集合進行采樣,采用基于skip-gram的方法得到節點的結構嵌入向量;
S2、構建卷積神經網絡來處理節點的文本信息,獲得節點的文本信息嵌入向量;
S21、構建一個卷積神經網絡,卷積神經網絡包括卷積層、交互層、池化層和全連接層;
S22、給定一由兩個節點組成的節點對,該節點對中每一個節點對應一個單詞序列,卷積層將每一個單詞序列中每一個單詞轉換為相應的詞向量,從而得到詞嵌入序列;通過卷積層提取詞嵌入序列的局部的特征,利用卷積矩陣對滑動窗口進行卷積運算,分別得到該節點對的詞嵌入序列的卷積結果矩陣M和N,然后采用非線性激活函數計算得到該節點對的相關矩陣H;
S23、在交互層嵌入節點對的詞嵌入序列的卷積結果,并計算該節點對中兩個節點之間的兩個交互權重;
S24、在池化層采用均值池化方法對卷積層得到的相關矩陣進行下采樣,分別得到該節點對的采樣向量;將該節點對所計算的兩個交互權重分別與相對應節點的采樣向量相結合,最終得到該節點對中兩個節點的文本信息嵌入向量;
S3、將節點的結構嵌入向量和文本信息嵌入向量進行聯合嵌入;
S31、根據給定節點的結構嵌入向量和文本信息嵌入向量,根據哈達瑪積運算,獲得給定節點的聯合嵌入向量;
S4、生成訓練集和測試集;
S41、將每個節點的聯合嵌入向量進行歸一化處理;
S42、對于網絡中的節點,將兩兩節點的聯合嵌入向量由哈達瑪積運算組合生成它們之間連邊的嵌入向量,由此得到網絡中所有連邊的嵌入向量,
S43、將所有連邊的嵌入向量按照設定比例隨機選取一部分作為訓練集,剩余數據作為測試集;
S5、構建神經網絡進行二分類學習;
S51、構建神經網絡;
S52、使用交叉熵損失函數作為神經網絡的損失函數進行二分類學習,使用Adadelta算法作為優化函數對構建的神經網絡進行優化;
S6、訓練神經網絡;
S61、將訓練集輸入到構建的神經網絡中;
S62、設置神經網絡的迭代次數,通過選取樣本訓練神經網絡并更新參數;
S7、預測結果;
S71、將測試集中的每個樣本輸入到已經訓練好的神經網絡中,得到預測的結果;
S72、計算預測結果分類的性能指標值,得到在各個訓練比例下的網絡鏈路預測的結果。
2.如權利要求1所述的基于網絡結構和文本信息的鏈路預測方法,其特征在于,所述步驟S22中的卷積運算步驟為:
S221、給定一個詞序列S=(ω1,ω2...ωp),p為詞序列S的長度,卷積層將每一個單詞ωi轉換為相應的詞向量wi∈Rd,這樣就得到了詞嵌入序列S=(w1,w2...wp),這里d表示詞嵌入的維數,然后在卷積層,利用卷積矩陣C∈Rd×(l×d)對長度為l的滑動窗口進行卷積運算
xi=C·Si:i+l-1+b
其中xi表示第i個窗口內的單詞序列的卷積結果,Si:i+l-1表示第i個窗口內單詞嵌入序列,b是一個參數;
S222、給定兩個節點u和v的相應的兩個詞嵌入序列Su和Sv,通過卷積層,得到矩陣M∈Rd×m和N∈Rd×n,m和n表示Su和Sv的長度,然后采用非線性激活函數ReLU對于所獲得的矩陣M和N計算相關矩陣H=ReLU(MTN)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010113634.3/1.html,轉載請聲明來源鉆瓜專利網。





