[發明專利]基于圖神經網絡特征聚合的謠言檢測方法及裝置有效
| 申請號: | 202110402464.5 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113139052B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 馬凱;劉小迪;徐守志;馬圓圓;向舜陟 | 申請(專利權)人: | 三峽大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30;G06N3/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 楊云云 |
| 地址: | 443002 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 特征 聚合 謠言 檢測 方法 裝置 | ||
1.一種基于圖神經網絡特征聚合的謠言檢測方法,其特征在于,包括:
獲取第一事件源文本圖;
將所述第一事件源文本圖和訓練標簽輸入至預設第一圖神經網絡模型進行訓練,以確定圖神經網絡預測模型;
將待檢測的第一事件源文本圖輸入至所述圖神經網絡預測模型,以對互聯網中的事件源文本及響應推文進行謠言檢測;
其中,事件源文本圖是通過將所述事件源文本進行圖結構建模得到的;
所述訓練標簽是通過采用預設編碼方式對所述事件源文本和所述響應推文進行標注后得到的;
所述獲取第一事件源文本圖,包括
對事件源推文預處理,并對預處理后的事件源推文進行圖結構建模,以獲取第二事件源推文圖;
將所述第二事件源推文圖輸入至訓練好的第二圖神經網絡模型,以獲取事件源推文的文本級特征向量;
根據事件源文本的詞向量和所述文本級特征向量,獲取所述第一事件源文本圖;
其中,所述事件源推文包括所述事件源文本和所述響應推文。
2.根據權利要求1所述的基于圖神經網絡特征聚合的謠言檢測方法,其特征在于,所述對事件源推文預處理,包括:
去除所述事件源文本中的亂碼數據和空行數據;以及
去除所述事件源的響應推文的冗余項;
其中,所述冗余項包括轉發但未評論的事件源的響應推文、亂碼數據和空行數據。
3.根據權利要求1所述的基于圖神經網絡特征聚合的謠言檢測方法,其特征在于,所述事件源文本的詞向量通過如下方式獲取:
去除所述事件源文本中的亂碼數據和空行數據,獲取滿足預設條件的事件源文本;
對滿足所述預設條件的事件源文本分詞預處理,并將分詞預處理后的滿足所述預設條件的事件源文本輸入至訓練好的BERT模型,以獲取所述事件源文本的詞向量;
其中,所述分詞預處理包括分詞處理和去停用詞處理。
4.根據權利要求3所述的基于圖神經網絡特征聚合的謠言檢測方法,其特征在于,所述根據事件源文本的詞向量和所述文本級特征向量,獲取所述第一事件源文本圖,包括:
獲取所述文本級特征向量中表示所述事件源推文的向量;
獲取所述事件源文本的詞向量表示的詞語;
將所述詞語與預處理后的事件源文本進行對應,確定所述詞語所屬事件;
根據所述詞語所屬事件,確定所述詞語與所述事件源推文的向量之間的映射字典;
根據所述事件源文本的詞向量和所述映射字典,確定所述事件源推文的聚合特征向量;
通過將所述聚合特征向量作為所述第一事件源文本圖的節點集以及將所述詞語之間的共現關系作為所述第一事件源文本圖的邊集,以獲取所述第一事件源文本圖。
5.根據權利要求1所述的基于圖神經網絡特征聚合的謠言檢測方法,其特征在于,所述訓練好的第二圖神經網絡模型通過如下方式獲取:
將所述第二事件源推文圖和所述訓練標簽輸入至預設第二圖神經網絡模型進行訓練,根據預設第一更新規則和預設第一激活函數對所述第二事件源推文圖中的每個節點進行第一次更新;
根據第一次更新后的節點、預設分層傳播規則和預設嵌入矩陣向量,確定所述事件源推文的文本級特征向量;
根據所述文本級特征向量,獲取所述預設第二圖神經網絡模型的第一交叉熵函數,并在所述第一交叉熵函數小于第一預設閾值時,停止訓練,以獲取所述訓練好的第二圖神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三峽大學,未經三峽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110402464.5/1.html,轉載請聲明來源鉆瓜專利網。





