[發明專利]一種基于圖注意力網絡的社交媒體謠言檢測方法和系統有效
| 申請號: | 202110542802.5 | 申請日: | 2021-05-19 |
| 公開(公告)號: | CN113268675B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 陳宇;肖正;聶振宇;王夢圓;郭修遠 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/35;G06F16/33;G06F40/284;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 武漢臻誠專利代理事務所(普通合伙) 42233 | 代理人: | 宋業斌 |
| 地址: | 410082 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 網絡 社交 媒體 謠言 檢測 方法 系統 | ||
1.一種基于圖注意力網絡的社交媒體謠言檢測方法,其特征在于,包括如下步驟:
(1)獲取待檢測的謠言事件,對待檢測的謠言事件對應的文本進行預處理,以得到預處理后的文本,并使用BERT-Large-Cased預訓練詞向量模型將預處理后的文本轉換成文本向量矩陣;
(2)根據步驟(1)得到的待檢測的謠言事件對應的用戶之間的轉發、評論或回復關系構建用戶關系結構圖表示為G=(V,E),并根據該用戶關系結構圖構建鄰接矩陣,其中V表示節點集合,每個節點表示待檢測的謠言事件對應的一個用戶,E表示邊的集合,每條邊表示兩個用戶之間的轉發、評論或回復關系;
(3)將步驟(1)得到的文本向量矩陣、以及步驟(2)得到的鄰接矩陣,輸入預先訓練好的謠言檢測模型中,以得到最終的謠言檢測結果;謠言檢測模型是通過以下步驟訓練得到的:
(3-1)獲取謠言數據,按照8:2的比例將謠言數據劃分為訓練集和測試集,對訓練集中每個謠言數據對應的文本進行預處理,以得到預處理后的文本,使用BERT-Large-Cased預訓練詞向量模型將預處理后的文本轉換成文本向量矩陣X,根據訓練集中每個謠言數據對應的用戶之間的轉發、評論或回復關系構建用戶關系結構圖,并根據該用戶關系結構圖構建鄰接矩陣A;
(3-2)將步驟(3-1)得到的文本向量矩陣X和鄰接矩陣A輸入到第一圖注意力網絡中,以得到N·(n*h)的特征向量矩陣T;
(3-3)將步驟(3-1)得到的文本向量矩陣X和鄰接矩陣A輸入第一圖注意力網絡中第一個單頭圖注意力網絡的特征變換層,以得到維度為N·h的特征矩陣H;步驟(3-3)的計算公式為·:
H=Wh×X
其中Wh表示第一圖注意力網絡的初始權值參數矩陣,×表示矩陣乘法;
(3-4)將步驟(3-3)得到的特征矩陣H輸入第一圖注意力網絡中第一個單頭圖注意力網絡的注意力計算層,以得到每個謠言事件對應的節點之間的注意力系數;步驟(3-4)的計算公式為:
eij=a([hi||hj]),j∈Ai
其中hi表示步驟(3-3)得到的特征矩陣H中的第i行向量,Ai為鄰接矩陣A中的第i行向量,j∈Ai表示為鄰接矩陣A中的第i行向量值為1的節點,[hi||hj]表示對hi和hj進行拼接,a(.)表示把拼接后的特征通過前饋神經網絡映射到實數,這樣就得到任意兩個節點之間的注意系數eij,其中如果Aij為0,則eij也為0,表示節點i和節點j沒有轉發、評論或回復關系;
(3-5)對步驟(3-4)得到的每個謠言事件對應的節點之間的注意力系數eij進行歸一化處理,以得到歸一化后的注意力系數αij;
(3-6)將步驟(3-3)得到的特征矩陣H和步驟(3-5)歸一化后的注意力系數αij輸入第一圖注意力網絡中第一個單頭圖注意力網絡的鄰接頂點特征聚合層,以得到N·h的特征矩陣;
(3-7)針對第一圖注意力網絡中剩余的n-1個單頭圖注意力網絡中的每一個而言,重復上述步驟(3-3)至(3-6),從而得到n-1個維度為N·h的特征矩陣,將這n-1個維度為N·h的特征矩陣與步驟(3-6)得到的特征矩陣進行拼接,從而得到N·(n*h)的特征矩陣;
(3-8)對步驟(3-2)得到的特征向量矩陣T進行drop_out處理,以得到N·(n*h)的特征向量矩陣T`,其中隨機失活的比例為0.5;
(3-9)將步驟(3-8)得到的特征向量矩陣T`和步驟(3-1)得到的鄰接矩陣A輸入到第二圖注意力網絡中,以得到每個謠言數據的高階表示所對應的向量矩陣W,其維度為N·h;
(3-10)將步驟(3-9)得到的向量矩陣W中的第一行向量w0復制n份,并沿著y軸的方向對復制的n份向量進行拼接,以得到大小為N·h的向量矩陣W0;
(3-11)將步驟(3-9)得到的向量矩陣W和步驟(3-10)得到向量矩陣W0進行拼接,以獲得特征向量矩陣W`,其維度為N·(2*h);
(3-12)將步驟(3-11)得到的特征向量矩陣W`輸入全連接網絡進行分類,以獲得是否為謠言的概率向量p,其中概率向量P的長度為2;
(3-13)對步驟(3-12)得到的概率向量p先進行softmax運算以得到歸一化后的概率向量p`,之后對歸一化后的概率向量p`進行l對數運算,以得到最后的分類標簽向量y,其長度為2;
(3-14)根據步驟(3-13)得到的分類標簽向量y計算損失函數,并利用該損失函數對謠言檢測模型進行迭代訓練,直到該謠言檢測模型收斂為止,從而得到初步訓練好的謠言檢測模型;
(3-15)使用步驟(3-1)得到的測試集對步驟(3-14)初步訓練好的謠言檢測模型進行驗證,直到得到的分類精度達到最優為止,從而得到訓練好的謠言檢測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110542802.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種穿戴固定結構及可穿戴設備
- 下一篇:一種多功能變形衣柜





