[發明專利]一種謠言檢測方法及計算機可讀存儲介質有效
| 申請號: | 202011245739.0 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112270174B | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 肖喜;魏子瑜;夏樹濤;鄭海濤;江勇;陸孺牛 | 申請(專利權)人: | 清華大學深圳國際研究生院 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F16/31;G06K9/62;G06N3/04 |
| 代理公司: | 深圳新創友知識產權代理有限公司 44223 | 代理人: | 孟學英 |
| 地址: | 518055 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 謠言 檢測 方法 計算機 可讀 存儲 介質 | ||
本發明提供一種謠言檢測方法及計算機可讀存儲介質,方法包括:對于社交平臺上的每一條動態,收集動態所有的回復和/或轉發,將動態視作一個節點,則動態回復和/或轉發為所述動態的子節點,節點和所述子節點構成一棵傳播樹;確定傳播樹中各個節點包含的子節點的數目并從多到少排序,依序選取至少一個節點與其所包含的子節點構成傳播樹的關鍵子樹;關鍵子樹中的根節點為源節點;基于每個關鍵子樹中每個節點和每個子節點的原始數據計算所述傳播樹特征,特征包括文本內容相關特征、用戶相關特征、傳播結構相關特征;構建SLS神經網絡模型用于學習特征;訓練SLS神經網絡模型并對社交平臺上的動態進行謠言檢測。提高謠言檢測任務的分類準確度。
技術領域
本發明涉及謠言檢測技術領域,尤其涉及一種謠言檢測方法及計算機可讀存儲介質。
背景技術
隨著互聯網的發展,信息的傳播變得越來越迅速,越來越便捷,網民們只需動動手指便可參與到信息的傳播過程當中。但與此同時,謠言的傳播也變得及其容易,在微博類似的網絡社交平臺,有很多謠言盛行,給社會造成了極大危害。這種情況下,社交平臺的用戶既是謠言的傳播者,也是謠言的受害者。
由于近些年來,網絡發展日新月異,信息傳播的方式以及特點也在不斷發生變化,社交網絡的環境更是變得動態且復雜,語義理解、異構傳播結構等問題使得準確地完成謠言檢測任務成為一個巨大挑戰。
傳統的謠言檢測方法主要用到支持向量機、決策樹等機器學習算法,從文本和用戶信息中提取特征,例如文本中是否包含鏈接、用戶的粉絲數、點贊數、轉發數等等。傳統的機器學習算法速度快,可解釋性較好,但是準確度并不能滿足需求。之后出現了神經網絡相關的方法,例如卷積神經網絡、循環神經網絡、長短期記憶網絡、圖神經網絡等,這些深度學習的方法可以學習到謠言的更高層表示,提高了準確度,且一些神經網絡方法也考慮到了傳播模式相關的特征。但是這些方法用到的神經網絡模型較為簡單、單一,并不涉及復雜的網絡結構,對于謠言檢測任務也沒有針對性,且很多神經網絡相關方法忽視了傳統方法中用到的很多有效的特征。
現有技術中缺乏一種準確度高的謠言檢測方法。
以上背景技術內容的公開僅用于輔助理解本發明的構思及技術方案,其并不必然屬于本專利申請的現有技術,在沒有明確的證據表明上述內容在本專利申請的申請日已經公開的情況下,上述背景技術不應當用于評價本申請的新穎性和創造性。
發明內容
本發明為了解決現有的問題,提供一種謠言檢測方法及計算機可讀存儲介質。
為一種謠言檢測方法,包括如下步驟:S1:對于社交平臺上的每一條動態,收集所述動態所有的回復和/或轉發,將所述動態視作一個節點,則所述動態回復和/或轉發為所述動態的子節點,所述節點和所述子節點構成一棵傳播樹;S2:確定所述傳播樹中各個所述節點包含的所述子節點的數目并從多到少排序,依序選取至少一個所述節點與其所包含的所述子節點構成所述傳播樹的關鍵子樹;所述關鍵子樹中的根節點為源節點;S3:基于每個所述關鍵子樹中每個所述節點和每個所述子節點的原始數據計算所述傳播樹特征,所述特征包括文本內容相關特征、用戶相關特征、傳播結構相關特征;S4:構建SLS神經網絡模型用于學習所述特征;S5:訓練所述SLS神經網絡模型并用訓練好的所述SLS神經網絡模型對所述社交平臺上的動態進行謠言檢測。
優選地,所述原始數據包括用戶識別碼、動態的識別碼、所述動態的節點的父節點的識別碼、用戶身份是否經過官方驗證、是否包含圖片或視頻、原始文本、轉發數、評論數、點贊數、收藏數、創建時間、用戶名稱、用戶建立時間。
優選地,所述文本內容相關特征包括:所述節點的文本的情感分數、關鍵子樹的平均文本長度、關鍵子樹的平均情感分數、關鍵子樹中表示質疑的節點所占百分比、關鍵子樹中文本包含問號的節點所占百分比、關鍵子樹中文本包含感嘆號的節點所占百分比、關鍵子樹中包含圖片和視頻的節點所占百分比、關鍵子樹中文本包含URL鏈接的節點所占百分比、關鍵子樹中文本包含@符號的節點所占百分比。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學深圳國際研究生院,未經清華大學深圳國際研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011245739.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種不易脫落的通訊連接器
- 下一篇:小程序死鏈檢測方法及設備、計算設備和介質





