[發明專利]基于動態表達學習的不實信息檢測方法和裝置在審

申請號：	201710085225.5	申請日：	2017-02-16
公開（公告）號：	CN106910013A	公開（公告）日：	2017-06-30
發明（設計）人：	譚鐵牛;王亮;吳書;劉強;余峰	申請（專利權）人：	中國科學院自動化研究所
主分類號：	G06Q10/06	分類號：	G06Q10/06;G06Q50/00;H04L29/06
代理公司：	中科專利商標代理有限責任公司11021	代理人：	鐘文芳
地址：	100190 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于動態表達學習不實信息檢測方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及計算機模型檢測技術領域，尤其涉及一種基于動態表達學習的不實信息檢測方法和裝置。

背景技術

社交媒體的飛速發展使網絡用戶體驗到了前所未有的便捷。社交媒體例如Facebook，Twitter和新浪微博為用戶提供了可以共享信息和公開發表個人能言論的平臺。但與此同時，社交平臺上不實信息的傳播也為用戶帶來了極大的困擾，也危害了社會和諧和公共安全。近年來，信息可信度檢測引起了學術界和工業界極大的關注。

現今方法中考慮到的信息主要包括以下幾個種類：正文信息、來源可信信息、動態信息和評論信息；評價用戶行為可信度因素主要包括：時間、人物、行為、方式。事實發現法是一種無監督或半監督方法，用于在沖突數據中發現事實和檢測信息可信度。基于上述信息，已有方法主要關注于人工特征，但其較為繁瑣并且無法得出數據的基本特征。同時，現今方法無法模擬信息傳播時不同信息種類和不同可信性因素的關聯性。事實發現法主要基于來源可信信息且檢測到的可信度集合于各個來源。但事實發現法僅適合于在理想情況特定的主題中，例如價格預測和航班預測，并不適用于社交媒體這種復雜環境之中。

近年來，很多在社交媒體能自動測量信息可信度的方法得到廣泛的應用。這些方法主要基于消息級別或事件級別的正文信息和來源可信信息。還有研究綜合考慮了消息級別和事件級別。針對于動態信息，一些研究定義了傳播過程中的時間特征或者訓練具有不同時間段特征的模型。針對于評論信息，研究采取了用戶反饋或標志微博方式表明可疑信息。盡管這些方法被廣泛使用，但因建立在特征工程上，就顯得較為繁瑣并且無法得出數據的基本特征。同時，現今方法無法模擬信息傳播時不同信息種類和不同可信性因素的關聯性。

DBRM模型致力于根據社交媒體上用戶發布和轉發的內容來判斷該事件是否為不實信息。模型集合用戶行為因素：用戶可信度、事件發生時間間隔、用戶發布和轉發行為和用戶評論信息，可用來判斷一條消息的可信度。模型引入了表征學習方法(representation learning method)，與傳統特征工程(feature engineering)不同的是的它能夠抓取在傳播過程中不同方面的信息。模型學習了用戶，動態時間間隔，用戶行為和評論態度的隱含表示(1atent representation)。基于這些隱含表示，模型可生成信息的動態行為表示并在可信度檢測方面提出了創新。

發明內容

鑒于傳統基于人工特征的方法存在技術缺陷，為了更好檢測信息可信度，本發明提供一種基于動態行為特征表示的檢測方法和裝置。

根據本發明一方面，提供了一種基于動態表達學習的不實信息檢測方法，包括以下步驟：

獲取待檢測信息；

利用預先建立的檢測模型對所述待檢測信息進行檢測；

輸出檢測結果；

其中，檢測模型如下建立：

步驟S1，首先建模聯合表示用戶信息和該用戶行為信息的某一事件的動態行為表達式；用戶信息包含用戶的特征和用戶可信度，行為信息包含行為類型；

步驟S2，一個事件由不同信息組成，結合步驟S1中的所述動態行為表達式，最終得出事件可信度檢測表達式；

步驟S3，運用時間特征矩陣來取得在信息傳播過程中用戶動態行為特征連

步驟S4，生成用戶特征表達；

步驟S5，利用配對學習法估算檢測模型參數。