[發明專利]一種基于群智數據融合的假消息早期檢測方法在審
| 申請號: | 201911015855.0 | 申請日: | 2019-10-24 |
| 公開(公告)號: | CN110765108A | 公開(公告)日: | 2020-02-07 |
| 發明(設計)人: | 郭斌;吳廣智;丁亞三;於志文;王柱;王亮;梁韻基 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06N3/04 |
| 代理公司: | 61222 西安利澤明知識產權代理有限公司 | 代理人: | 劉偉 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評論 用戶屬性 學習 時序 內容特征 神經網絡 屬性特征 數據資源 特征融合 消息識別 早期檢測 融合 基于群 準確率 環節 聯合 | ||
本發明提供一種基于群智數據融合的假消息早期檢測方法,建立評論模型:利用2層GRU單元的Attention?RNN學習評論特征;建立用戶屬性模型:利用CNN學習用戶屬性特征;建立聯合模型:融合兩部分特征,得到最終的消息識別結果。本發明通過Attention?RNN(Recurrent Neural Network,RNN)學習消息下評論的時序以及內容特征;利用CNN(Convolutional Neural Network,CNN)學習消息下評論用戶的屬性特征,最終將兩部分特征融合,經過全連接神經網絡得到識別結果。充分利用早期稀缺的數據資源,且避免繁重的人工設置特征的環節,提高了識別的準確率。
技術領域
本發明涉及深度學習識別系統領域,尤其涉及一種基于群智數據融合的假消息早期檢測方法。
背景技術
社交媒體平臺的假消息早期識別是網絡時代必要的安全應用之一。目前已經有了大量假消息識別的研究,他們分別基于內容、傳播、用戶等角度識別消息真假。具體地,基于內容的假消息識別,該類方法類似于從知識或規則的角度研究假消息,主要基于假消息中特定的書寫風格或者聳人聽聞的標題等進行判斷,比如詞匯特征、句法特征、主題特征、圖像特征等。基于傳播的假消息識別,該類方法主要利用社交網絡的傳播特性,將消息和用戶映射到特定的網絡來評估事件的整體可信度,比如傳播網絡(Diffusion Network),用戶-信息-事件網絡(User-Message-Event Network),內容分層網絡(Hierarchical ContentNetwork)以及對立觀點網絡(Conflicting Viewpoints Network)等。基于用戶可靠性的假消息識別,該類方法從用戶的角度評估消息的可信度,假消息傳播過程中,可能存在大量“水軍”或者“僵尸”,利用用戶畫像的方法抽取用戶的特征能夠幫助提高假消息識別準確率。用戶的可靠性主要通過用戶的類型、年齡、是否有認證信息、粉絲數、關注數、原創博客數等進行衡量。盡管這些方法在假消息識別上有較好的準確率,但基于內容的識別方法容易被針對性破解,其他兩種方法都需要充分的數據支持。若在早期數據稀缺的情況下,可能得不到較好的結果,于是充分利用早期數據成為假消息早期識別的關鍵。
發明內容
針對以上缺陷,本發明提供一種基于群智數據融合的假消息早期檢測方法。
近三年,深度學習在文本處理、圖像識別、計算機視覺已取得巨大成功,在識別系統方面也取得了很多突破,表明深度學習可以從內容中直接提取特征,可以更加準確地學習文本和用戶的潛在特征。在識別系統中常用的深度學習方法有兩種:循環神經網絡(Recurrent Neural Network,RNN)、卷積神經網絡(Convolutional Neural Network,CNN)。循環神經網絡通常用來學習具有一定長度的時間序列的特征,在自然語言處理上的運用取得了較大的成果;卷積神經網絡通常用來學習圖像的多種局部特征,在圖像識別等領域上取得了較大的成果。由于圖像的本質是矩陣,卷計算機網絡可以引申到矩陣的學習,提取矩陣中的特征。通過深度學習的方法得到特征,最終從特征得到識別結果。
本發明的技術方案為:一種基于群智數據融合的假消息早期檢測方法,通過建立評論模型:利用2層GRU單元的Attention-RNN學習評論特征;建立用戶屬性模型:利用CNN學習用戶屬性特征;建立聯合模型:融合兩部分特征,得到最終的消息識別結果。
具體的,一種基于群智數據融合的假消息早期檢測方法包括以下步驟:
S1:獲取社交媒體平臺上新聞事件消息的帖子,以及帖子下的評論和發表評論的用戶的相關信息;
S2:對新聞事件消息的真假性進行標注;
S3:對新聞事件下的評論做向量嵌入,構成時間序列,通過Attention-RNN學習序列中的特征;
S4:對新聞事件下評論用戶做向量嵌入,使用用戶的屬性信息代表用戶,構成用戶矩陣,通過CNN學習矩陣中的特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911015855.0/2.html,轉載請聲明來源鉆瓜專利網。





