[發明專利]基于層疊泛化和代價敏感學習的社交網鏈路異常預測方法有效
| 申請號: | 202010873960.4 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN112039700B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 劉小洋;李祥;葉舒;馬敏 | 申請(專利權)人: | 重慶理工大學 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/26 |
| 代理公司: | 重慶天成卓越專利代理事務所(普通合伙) 50240 | 代理人: | 王宏松 |
| 地址: | 400054 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 層疊 泛化 代價 敏感 學習 社交 網鏈路 異常 預測 方法 | ||
本發明提出了一種基于層疊泛化和代價敏感學習的社交網絡鏈路異常預測方法,包括以下步驟:S1,獲取社交網絡節點數據,將獲取的社交網絡節點數據中的相似性指標作為基模型學習的特征;S2,確定基模型的超參數;S3,對基模型的預測結果進行重新學習;得到最終的預測結果。本發明能夠對社交網絡節點鏈路異常進行預測。
技術領域
本發明涉及一種社交網絡技術領域,特別是涉及一種基于層疊泛化和代價敏感學習的社交網絡鏈路異常預測方法。
背景技術
在現實世界中,社交網絡無處不在,例如社交網絡,協作網絡,蛋白質-蛋白質相互作用網絡和通信網絡。分析這些網絡不僅在計算機科學領域,而且在社會學,物理學,生物信息學和統計領域都引起了越來越多的關注。社交網絡中的鏈接預測是一項基本的網絡分析任務,指如何預測在網絡中尚未通過已知信息(如網絡節點和網絡結構)連接的兩個節點之間生成鏈接的可能性。應該注意的是,鏈接預測包括對現有鏈接的預測和對未來鏈接的預測。
社交網絡的鏈路預測已經深入研究。在過去的幾十年中,已經提出了各種鏈路預測方法,并且大多數算法都基于網絡結構。在這里,我們簡要回顧兩種用于鏈接預測的主流方法,相似性方法(包括節點相似性和結構相似性)和似然估計方法。到目前為止,基于相似度的鏈路預測方法已經取得了一系列成果,并相應地廣泛應用于各個領域。基于相似度鏈路預測方法可以進一步分為三類,即基于鄰居的,基于路徑的和基于隨機游走的方法。最簡單的鏈接預測方法基于以下假設:兩個節點如果有更多共同的鄰居,則更可能具有鏈接。Newman首先使用Common Neighbor index(CN)來衡量相似度隨后提出了兩個節點的索引,并提出了CN的許多變體,例如Salton index,Resource Allocation index(RA),Adamic-Adar index(AA),Jaccard CoefficientHub Promoted index(HPI),Leicht-Holme-Newmanindex(LHN),Preferential Attachment index(PA)等。根據對真實網絡的廣泛實驗,結果表明,RA指數表現最佳,而PA指數的整體表現最差。基于路徑方法使用兩個節點之間的路徑計算節點對的相似性。示例包括Local path index(LP)和Katz指數。LP索引僅考慮長度為2和3的本地路徑。Katz索引基于整體所有路徑,并且可以在實際網絡上獲得高性能。基于隨機游走的方法使用隨機游走來對網絡中節點之間的交互進行建模。一些代表性的方法包括Average Commute Time(ACT),SimRank,RandomWalk with Restart(RWR)和Local RandomWalk(LRW)。ACT指數基于平均值隨機步行者從一個節點開始到達另一節點所需的步驟數。SimRank測量分別從兩個不同的節點開始的兩個隨機游走者將在某個節點相遇的時間。RWR是一個PageRank算法的直接應用。LRW是一個本地索引,只關注幾步隨機游動。眾所周知,LRW方法優于ACT索引,其計算復雜度低于ACT和RWR。第二類方法是基于似然估計的。Clauset et al.提出了一種通用技術推斷網絡的層次結構,并進一步將其用于預測丟失的鏈接。The stochastic block model將網絡節點分為幾組,任意兩個節點之間的連接概率為決定節點屬于哪個組。Pan et al.基于預定義的結構哈密頓量最大化觀察到的網絡的可能性,并通過將鏈接添加到的條件概率對未觀察到的鏈接評分觀察到的網絡。Liben-Nowell和Kleinberg提出了鏈接預測的似然估計方法。之后,相繼獲得了基于似然分析的新的鏈接預測方法這些最大似然方法雖然計算復雜度較高,但可以提供有價值的見解。
相似度方法和似然估計方法各有其優缺點。基于相似度的方法具有計算復雜度低的特點,但是其計算結果將受到網絡結構的影響。在具有不同結構特征的網絡中,計算結果不穩定并且無法獲得魯棒性。基于似然估計的思想具有很強的數學意義和較高的預測精度,但是需要嚴格的假設,并且計算量大,不適合大規模網絡。
發明內容
本發明旨在至少解決現有技術中存在的技術問題,特別創新地提出了一種基于層疊泛化和代價敏感學習的社交網絡鏈路異常預測方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶理工大學,未經重慶理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010873960.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種板式分餾塔
- 下一篇:一種聯網洗衣機前面板輸送調節輔助機構





