[發明專利]一種社交網絡中的不良實體傳播抑制方法在審
| 申請號: | 202211041720.3 | 申請日: | 2022-08-29 |
| 公開(公告)號: | CN115426153A | 公開(公告)日: | 2022-12-02 |
| 發明(設計)人: | 毛勇超;周波;宣琦;呂宇乾 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;H04L41/12;H04L41/14;H04L41/147;H04L51/52 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 舒良 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 網絡 中的 不良 實體 傳播 抑制 方法 | ||
1.一種社交網絡中的不良實體傳播抑制方法,其特征在于:包括以下步驟:
S1:假設存在一個無向無權網絡G,基于SIR模型的游走策略,假設以網絡G中某個節點為不良實體傳播的起始點,在圖中進行游走采樣,記錄該起始點的不良實體傳播路徑,構建語料庫,同時記錄被該起始點傳染的節點ID列表,重復以上操作直至遍歷所有節點;
S2:將步驟S1所述語料庫置于word2vec模型中訓練,使用訓練完成的模型,構建節點特征矩陣,計算節點相似性矩陣,獲得網絡G中各個連邊的節點對相似度sim1;
S3:根據步驟S1所述網絡G中以不同節點為起始點的被傳染節點ID列表,計算網絡G中各個連邊的節點對之間存在相同的被傳染節點ID的數量,歸一化計算網絡G中各個連邊的節點對相似度sim2;
S4:將sim1和sim2的加權平均數作為網絡G中連邊的權值,排序連邊權值,刪除top-k的連邊能有效抑制不良實體的傳播。
2.如權利要求1所述的一種社交網絡中的不良實體傳播抑制方法,其特征在于:所述步驟S1包括:
假設存在無向無權社交網絡G=(V,E),V是網絡中節點的集合,E是網絡中連邊的集合,構建SIR模型,設置時間窗口為days=100,設置感染率β=0.1,設置恢復率γ=0.05,以網絡中的某個節點為初始感染者,其余節點為易感者,記錄該節點感染傳播的路徑,構建語料庫,同時記錄被該起始點傳染的節點ID列表,重復以上操作直至遍歷網絡G中的所有節點。
3.如權利要求1所述的一種社交網絡中的不良實體傳播抑制方法,其特征在于:所述步驟S2包括:
將所有所述傳播路徑組成列表格式,作為語料庫輸入word2vec模型中,設置vector_size=64,即節點嵌入的維度為64,構建詞匯表并且訓練,保存訓練完成的模型,構建節點特征矩陣,其維度應為|V|×64,計算節點之間的余弦相似度,如下式(1):
其中X,Y分別為64維的節點特征向量,構建以余弦相似度為矩陣元素的對稱矩陣|V|×|V|,可以根據網絡G中的連邊[a,b]檢索位于相似矩陣中第a行、第b列對應的值為sim1a,b,即為連邊[a,b]的一個相似度。
4.如權利要求1所述的一種社交網絡中的不良實體傳播抑制方法,其特征在于:所述步驟S3包括:
根據步驟S1所述網絡G中以不同節點為起始點的被傳染節點ID列表,計算網絡G各個連邊的節點對之間存在相同被感染節點ID的數量,記為num,構建節點對和相同節點ID數量的嵌套列表,例如[[a,b,numa,b],...],其中a,b為節點,numa,b代表節點對[a,b]之間相同被感染節點ID數量,歸一化計算網絡G中各個連邊的節點對[a,b]相似度sim2a,b,如下式(2):
其中,numa,b表示節點對[a,b]之間存在相同被感染節點ID的數量,nummax和nummin表示所有節點對中相同被感染節點數量的最大值和最小值。
5.如權利要求1所述的一種社交網絡中的不良實體傳播抑制方法,其特征在于:所述步驟S4包括:
將sim1a,b和sim2a,b的加權平均數作為網絡G中連邊的權值,如下式(3):
sima,b=0.5×sim1a,b+0.5×sim2a,b (3)
將sima,b作為連邊的權值寫入網絡G的邊列表,根據權值從大到小對所有連邊進行排序,刪除其中top-k的連邊可以有效抑制不良實體的傳播。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211041720.3/1.html,轉載請聲明來源鉆瓜專利網。





