[發明專利]一種謠言檢測方法及計算機可讀存儲介質有效
| 申請號: | 202011245739.0 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112270174B | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 肖喜;魏子瑜;夏樹濤;鄭海濤;江勇;陸孺牛 | 申請(專利權)人: | 清華大學深圳國際研究生院 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F16/31;G06K9/62;G06N3/04 |
| 代理公司: | 深圳新創友知識產權代理有限公司 44223 | 代理人: | 孟學英 |
| 地址: | 518055 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 謠言 檢測 方法 計算機 可讀 存儲 介質 | ||
1.一種謠言檢測方法,其特征在于,包括如下步驟:
S1:對于社交平臺上的每一條動態,收集所述動態所有的回復和/或轉發,將所述動態視作一個節點,則所述動態回復和/或轉發為所述動態的子節點,所述節點和所述子節點構成一棵傳播樹;
S2:確定所述傳播樹中各個所述節點包含的所述子節點的數目并從多到少排序,依序選取至少一個所述節點與其所包含的所述子節點構成所述傳播樹的關鍵子樹;所述關鍵子樹中的根節點為源節點;
S3:基于每個所述關鍵子樹中每個所述節點和每個所述子節點的原始數據計算所述傳播樹特征,所述特征包括文本內容相關特征、用戶相關特征、傳播結構相關特征;
S4:構建SLS神經網絡模型用于學習所述特征;所述SLS神經網絡模型由分離卷積網絡、長短期記憶網絡、壓縮和激勵網絡順序組成;
每個傳播樹的特征向量構成的矩陣X,矩陣X的形狀表示為(N,L);
其中,N表示數據集中所述傳播樹的數目,L則表示所述關鍵子樹的特征的個數;
將矩陣X變形為(N,1,L)并輸入到所述分離卷積網絡,所述分離卷積網絡包括三個大小不同的卷積核用于分組卷積,經過三層分離卷積層之后,輸出矩陣X表示為(N,1,L);
將經過所述分離卷積網絡的輸出矩陣變形為(L,N,1)并輸入到所述長短期記憶網絡,所述長短期記憶網絡用于捕捉全局信息,輸出矩陣表示為(L,N,H),H為所述長短期記憶網絡引入的參數;
將所述長短期記憶網絡輸出的矩陣變形為(N,H,L,W)輸入到所述壓縮和激勵網絡,W為參數;所述壓縮和激勵網絡引入注意力機制,用U∈RH×L×1表示每個關鍵子樹的特征圖,對每個通道應用全局平均池化,得到向量z∈RH;其中,第c個元素計算方法如下:
重新調整向量z的計算方法如下:
s=σ(w2δ(w1z))
其中,δ為ReLU激活函數,σ為sigmoid激活函數,r是所述壓縮和激勵網絡參數,控制這兩層全連接層的瓶頸形狀大小;
通過計算出的s對U進行重新調整:
outputc=scUc
將所述壓縮和激勵網絡的輸出重新調整表示為則SLS神經網絡模型的最終輸出為:
其中,FC表示一個全連接層,Softmax表示一個Softmax 層,為一個包含所述傳播樹屬于謠言和非謠言的概率的矩陣;
S5:訓練所述SLS神經網絡模型并用訓練好的所述SLS神經網絡模型對所述社交平臺上的動態進行謠言檢測。
2.如權利要求1所述的謠言檢測方法,其特征在于,所述原始數據包括用戶識別碼、動態的識別碼、所述動態的節點的父節點的識別碼、用戶身份是否經過官方驗證、是否包含圖片或視頻、原始文本、轉發數、評論數、點贊數、收藏數、創建時間、用戶名稱、用戶建立時間。
3.如權利要求2所述的謠言檢測方法,其特征在于,所述文本內容相關特征包括:所述節點的文本的情感分數、關鍵子樹的平均文本長度、關鍵子樹的平均情感分數、關鍵子樹中表示質疑的節點所占百分比、關鍵子樹中文本包含問號的節點所占百分比、關鍵子樹中文本包含感嘆號的節點所占百分比、關鍵子樹中包含圖片和視頻的節點所占百分比、關鍵子樹中文本包含URL鏈接的節點所占百分比、關鍵子樹中文本包含@符號的節點所占百分比。
4.如權利要求3所述的謠言檢測方法,其特征在于,所述用戶相關特征包括源節點賬號的存在時間、關鍵子樹中包含個人照片的節點所占百分比、關鍵子樹中已被認證的節點所占百分比、關鍵子樹所有節點的平均存在時間、關鍵子樹所有節點的平均粉絲數、關鍵子樹所有節點的平均轉發數、關鍵子樹所有節點的平均收藏數、關鍵子樹所有節點的平均發微博次數、源節點的粉絲數、源節點的轉發數、源節點的發推文次數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學深圳國際研究生院,未經清華大學深圳國際研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011245739.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種不易脫落的通訊連接器
- 下一篇:小程序死鏈檢測方法及設備、計算設備和介質





