[發明專利]一種基于原文和評論信息分析算法的虛假信息檢測方法有效
| 申請號: | 202011626342.6 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112765313B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 王莉;楊延杰;王宇航 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/216;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 太原高欣科創專利代理事務所(普通合伙) 14109 | 代理人: | 崔浩;冷錦超 |
| 地址: | 030024 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 原文 評論 信息 分析 算法 虛假 檢測 方法 | ||
本發明一種基于原文和評論信息分析算法的虛假信息檢測方法,屬于基于原文和評論信息分析算法的虛假信息檢測技術領域;所要解決的技術問題為:提供一種基于原文和評論信息分析算法的虛假信息檢測方法的改進;解決該技術問題采用的技術方案為:對評論與原文的全局結構信息捕獲,該過程分為評論關系結構信息捕獲和評論與原文的相互選擇,其中結構信息捕獲作用于依據評論的回復結構構建的回復圖,通過聚合具有回復結構關系的信息得到包含結構信息的評論的特征表示;捕獲評論內部的局部時序信息以得到評論的局部特征表,最后將生成的全局表示與局部表示拼接用于虛假信息檢測,得到該輸入文檔是否屬于虛假信息的概率值;本發明應用于虛假信息檢測。
技術領域
本發明一種基于原文和評論信息分析算法的虛假信息檢測方法,屬于基于原文和評論信息分析算法的虛假信息檢測技術領域。
背景技術
現有的虛假信息檢測算法按照研究對象的不同大致可以分為基于文本內容的方法、基于用戶的方法以及基于傳播的方法;基于文本內容的方法主要依賴原文信息進行檢測,這類方法的優勢在于數據獲取便利同時這類方法可以在信息發布的第一時間給出判斷而不依賴于外部信息,但是現在文本內容越來越具有強的誤導性和迷惑性,這將增加此類方法檢測的難度。另外社交媒體上的信息大多都是短文本,還會造成可用數據稀疏的問題;另一類檢測方法是基于用戶的方法,主要利用的用戶屬性等信息進行虛假信息檢測,但是由于隱私保護問題,往往難以獲取用戶的真實信息,限制了此類檢測方法的發展。
基于傳播的檢測方法主要利用社交媒體上信息傳播時產生的其他信息進行檢測,評論就是其中的一種信息,一方面評論一般與原文處于同一個頁面,這就為獲取數據帶來了便利;另一方面,評論內容可以看作是對于原文內容的補充,其中包含很多有價值的信息能夠幫助進行虛假信息檢測;現有的一些研究已經開始重視使用評論數據來輔助進行虛假新聞的檢測,其中一類方法為機器學習方法,此類方法主要通過設計與提取文章與評論中的統計特征用于分類,此類方法最大的問題是特征的設計與提取需要龐大的人力物力,同時特征設計較為單一,無法很好的適應復雜多變的真實環境;另外一類方法側重于使用深度學習的方法來解決此類問題,Ma等人將評論的時間序列建模為樹結構,利用遞歸神經網絡(RvNN)從評論中捕捉有用信息用于分類,ShuKai等人利用評論與原文之間的關系,提出了dEFEND模型來共同捕獲有用的評論和原文中重要的句子,并且提供了一定的可解釋性,但他們的研究是忽略了真實情景下原文與評論以及評論與評論之間的實際回復結構關系,而僅僅在語義層面考慮;另外Bian等人提出了一種用于謠言檢測的雙向BiGCN模型,通過雙向圖卷積網絡學習消息評論內部的結構特征,取得了良好的效果,但是他們的工作忽略了評論的時序信息,即忽略了不同時間段內評論的局部特征,導致對虛假信息檢測的準確度較差。
發明內容
本發明為了克服現有技術中存在的不足,所要解決的技術問題為:提供一種基于原文和評論信息分析算法的虛假信息檢測方法的改進。
為了解決上述技術問題,本發明采用的技術方案為:一種基于原文和評論信息分析算法的虛假信息檢測方法,包括如下檢測步驟:
步驟一:對評論與原文的全局結構進行信息捕獲,基于信息原文與評論以及評論與評論之間的回復關系構建回復結構圖,在原文和評論的全局角度,深入挖掘評論的回復結構信息和評論與原文的相互選擇;
步驟1.1:捕獲回復結構信息;對依據回復關系構建的回復結構圖,通過圖卷積神經網絡來依據結構聚合信息,得到每個節點包含結構信息的全局表示;
定義待檢測信息Pi的回復結構圖表示為Gi={Vi,Ei},其中Vi為節點集合,Ei為邊集合;定義節點集合表示原文節點和對應的m個評論,原文節點與評論兩兩之間依據是否具有回復關系相連,然后將該回復結構圖的鄰接矩陣和特征矩陣用于計算和學習結構表示,其中鄰接矩陣描述節點之間的拓撲結構,特征矩陣描述節點的特征表示;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011626342.6/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





