[發(fā)明專利]一種基于雙向傳播圖的多任務謠言檢測方法在審
| 申請?zhí)枺?/td> | 202110454550.0 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113094596A | 公開(公告)日: | 2021-07-09 |
| 發(fā)明(設計)人: | 楊鵬;匡晨;田楊靜;于曉潭 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯(lián)專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 雙向 傳播 任務 謠言 檢測 方法 | ||
本發(fā)明公開了一種基于雙向傳播圖的多任務謠言檢測方法,該方法可用于社交網(wǎng)絡帖子的謠言檢測以及評論信息的立場檢測。本發(fā)明首先根據(jù)謠言帖子的內(nèi)容生成文本特征矩陣、用戶特征矩陣和文本統(tǒng)計特征矩陣,之后構建謠言的雙向傳播圖,通過計算雙向圖卷積并進行根節(jié)點特征增強抽取謠言的傳播特征,最后對傳播特征進行平均池化和特征整合后,訓練softmax分類器,獲取謠言檢測和立場檢測結果。本發(fā)明能夠有效地獲取謠言的順序傳播特征和廣度散布特征,并且引入用戶評論的立場檢測作為輔助任務,從而提高模型的泛化性,進一步提高謠言檢測任務的準確率。
技術領域
本發(fā)明涉及一種基于雙向傳播圖的多任務謠言檢測方法,該方法可用于社交網(wǎng)絡帖子的謠言檢測以及評論信息的立場檢測,屬于互聯(lián)網(wǎng)與自然語言處理技術領域。
背景技術
近年來,社交網(wǎng)絡取得了快速發(fā)展,并迅速成為人們獲取新聞資訊的重要途徑之一。由于社交網(wǎng)絡的信息量龐大且傳播速度遠超于傳統(tǒng)媒介,大量未經(jīng)證實的謠言得以在網(wǎng)絡空間內(nèi)肆意傳播,并成為了一種日益嚴重的問題。互聯(lián)網(wǎng)已經(jīng)成為了繼陸地、海洋、天空、太空后的“第五空間”,而利用社交網(wǎng)絡平臺散布謠言,借機實施網(wǎng)絡犯罪、散布暴恐信息、煽動顏色革命等違法犯罪行為已對網(wǎng)絡空間安全構成了嚴峻的威脅。
現(xiàn)有社交網(wǎng)絡謠言檢測方法主要包括人工謠言檢測方法、基于機器學習的謠言檢測方法和基于深度學習的謠言檢測方法。大多數(shù)主流社交網(wǎng)絡平臺仍將人工謠言檢測方法作為甄別疑似謠言信息的主流機制,雖然有著較高的判別準確性,但存在滯后性,且受人為因素的影響較大,因而無法滿足社交網(wǎng)絡謠言檢測的需求。基于機器學習的方法將謠言檢測工作歸結為二分類問題,使用監(jiān)督學習方法自動檢測謠言信息,對特征工程有著較高的要求,且無法獲取謠言在傳播和散布過程中的深層特征,故無法獲得較高的識別率。而許多基于深度學習的謠言檢測方法從謠言的時序傳播結構入手,通過抽取謠言在傳播過程中深層特征檢測疑似謠言信息,往往僅注重謠言的順序傳播特征而忽視了廣度散布特征,因此在謠言檢測任務中仍存在一定的精度損失。
針對目前社交網(wǎng)絡謠言對網(wǎng)絡空間安全所構成的嚴峻威脅和現(xiàn)有謠言檢測方法無法有效抽取謠言傳播特征的問題,本發(fā)明提出一種基于雙向傳播圖的多任務謠言檢測方法,使用一種改進的雙向圖卷積神經(jīng)網(wǎng)絡(Bi-GCN)抽取謠言的順序傳播特征和廣度散布特征,并引入對評論文本的立場檢測作為輔助任務,提升謠言檢測任務的表現(xiàn)與泛化性,從而提高謠言檢測的準確率。
發(fā)明內(nèi)容
針對現(xiàn)有技術存在的問題與不足,本發(fā)明提供一種基于雙向傳播圖的多任務謠言檢測方法,該方法能夠實時檢測疑似謠言信息以及評論文本的立場,相比現(xiàn)有方法,能夠更有效地獲取謠言的順序傳播特征和廣度散布特征,從而改善現(xiàn)有謠言檢測方法準確率不足的問題。
為了實現(xiàn)上述目的,本發(fā)明的技術方案如下:一種基于雙向傳播圖的多任務謠言檢測方法,該方法涵蓋社交網(wǎng)絡謠言檢測的全過程,主要包括特征提取、特征融合、評論立場類型分類和謠言類型分類等過程,能夠有效地抽取謠言的傳播特征,從而提高謠言檢測任務的準確率。該方法主要包括三個步驟,具體如下:
步驟1,構筑謠言和立場樣本數(shù)據(jù)集。首先使用Twitter15和Twitter16數(shù)據(jù)集中的用戶uid,通過推特開放API獲取用戶信息,用于謠言檢測的任務訓練,同時,將PHEME數(shù)據(jù)集用于用戶評論立場檢測任務的訓練,二者共同構成多任務模型的訓練數(shù)據(jù)集。
步驟2,多任務分類模型訓練。對于數(shù)據(jù)集中的每一個謠言帖子,首先使用TF-IDF算法抽取其文本特征,并生成用戶特征和文本統(tǒng)計特征,之后構建謠言的雙向傳播圖,接著將文本特征、用戶特征和文本統(tǒng)計特征作為輸入,通過計算雙向圖卷積并進行根節(jié)點特征增強抽取謠言的傳播特征,最后對傳播特征進行平均池化和特征整合后,訓練softmax分類器。
步驟3,對待檢測帖子進行分類預測。對于待檢測帖子,首先提取其文本特征、用戶特征和文本統(tǒng)計特征,接著構建該帖子的雙向傳播圖,通過計算雙向圖卷積并進行根節(jié)點特征增強抽取傳播特征,利用訓練好的softmax分類器獲得謠言檢測和立場檢測的結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經(jīng)東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110454550.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種管接頭組件
- 下一篇:一種機器人視覺裝置及機器人





