[發明專利]基于傳播異質圖建模的社交媒體多模態謠言檢測方法有效
| 申請號: | 202010940942.3 | 申請日: | 2020-09-09 |
| 公開(公告)號: | CN112035669B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 毛震東;張勇東;陳鑫;王鵬輝 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/31;G06F40/289;G06K9/62;G06N3/04 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;韓珂 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 傳播 異質圖 建模 社交 媒體 多模態 謠言 檢測 方法 | ||
1.一種基于傳播異質圖建模的社交媒體多模態謠言檢測方法,其特征在于,包括:
獲取包含文本、圖像以及社交信息的待檢測事件;
基于預訓練模型進行從文本與圖像中各自提取文本特征與圖像特征,并對社交信息進行特征編碼,獲得社交信息特征;
基于文本特征、圖像特征以及社交信息特征構建社交媒體異質信息網絡圖結構,通過節點級別的注意力機制來捕獲不同的節點鄰居的重要性,通過信息聚合,實現將不同類型節點的信息通過注意力分數聚合到一起,實現特征的融合;
將融合的特征輸入至分類器,獲得檢測結果;
其中,所述社交信息包括:數字特征與類別特征;其中,數字特征包括:待檢測事件的轉發數目、點贊數目與發布時間、以及相應用戶的關注對象數目、粉絲數目以及發帖數目;類別特征包括:用戶ID、用戶類型、發布平臺及事件內容是否為原創;
對于數字特征,進行Z-Sore歸一化,表示為:
fnumerical=Z_Score[fretweet,fpraise,ffollower,ftime,ffollowing,ftweet]
其中,f表示特征,retweet表示轉發數目,praise表示點贊數目,following表示用戶的關注對象數目,time表示發布時間,follower表示用戶的粉絲數目,tweet表示用戶的發帖數目;
對于類別特征采用One-Hot編碼,并采用truncatedSVD進行降維處理,表示為:
fcategorical=[tsvd(fuid),tsvd(fplatform),foriginal,fusr-type]
其中,uid表示用戶id,platform表示用戶發表工具,original表示用戶發表內容是否為原創,user-type表示用戶類型,tsvd(.)表示采用truncatedSVD對特征進行降維處理;
再將fnumerical與fcategorical拼接,作為社交信息特征,表示為:
fsocial=Concat[fcategorical,fnumerical]。
2.根據權利要求1所述的一種基于傳播異質圖建模的社交媒體多模態謠言檢測方法,其特征在于,基于預訓練模型Bert進行中文文本特征提取,步驟包括:
首先,進行文本預處理:對文本進行數據清洗,去除非文本內容,并對清洗后的文本進行分詞,以及引入停用詞表,去除文本中無效詞語;
然后,將預處理后的文本輸入至預訓練模型Bert,得到文本特征。
3.根據權利要求1所述的一種基于傳播異質圖建模的社交媒體多模態謠言檢測方法,其特征在于,基于預訓練的卷積神經網絡進行圖像特征的提取;所述卷積神經網絡為去除卷積神經網絡ResNeSt中頂部全連接層后的網絡,網絡中最后一個池化層的輸出即為提取到的圖像特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010940942.3/1.html,轉載請聲明來源鉆瓜專利網。





