[發(fā)明專利]基于用戶生成內容的新聞認證預警方法及系統(tǒng)有效

申請?zhí)枺?/td>	201410414956.6	申請日：	2014-08-21
公開（公告）號：	CN104636408B	公開（公告）日：	2017-08-08
發(fā)明（設計）人：	曹娟;吳波;謝菲;張勇東;蘇宇;李錦濤;呂銳;曹學會	申請（專利權）人：	中國科學院計算技術研究所;新華通訊社
主分類號：	G06F17/30	分類號：	G06F17/30
代理公司：	北京律誠同業(yè)知識產權代理有限公司11006	代理人：	祁建國,梁揮
地址：	100190 北***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于用戶生成內容新聞認證預警方法系統(tǒng)
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發(fā)明涉及新聞認證領域，尤其涉及基于用戶生成內容的新聞認證預警方法及系統(tǒng)。

背景技術

隨著互聯(lián)網(wǎng)技術的深入人心和WEB2.0技術的蓬勃發(fā)展，普通用戶成為互聯(lián)網(wǎng)上的內容的主要生產者。UGC(User Generated Content)是用戶生成內容的簡稱，UGC新聞是在社會媒體(例如微博、博客、社交網(wǎng)絡等)中用戶們自發(fā)上傳或分享的新聞事件信息。UGC內容由于其具有反應及時、傳播快等特點，也成為傳統(tǒng)媒體的一個主要信息來源。但是，由于UGC內容的門檻低，任何用戶都可以向互聯(lián)網(wǎng)上傳內容，缺乏對UGC內容的有效監(jiān)管，UGC中存在著大量的虛假新聞，這也給傳統(tǒng)的通訊社在發(fā)布UGC信息帶來困擾。

從國內外研究進展來看，一方面，目前相關的研究主要針對UGC內容(非新聞內容)可信性，或者傳統(tǒng)新聞稿件(非UGC)可信性，建立全面而科學的信息可信度評價指標體系，而針對UGC新聞的研究還處于空白階段；另一方面，這些研究都是從傳播學，心理學，社會學的角度出發(fā)，通過問卷調查的方式進行理論分析。而在應用領域針對UGC新聞認證的研究才剛剛起步，暫時還沒有成熟的解決方案。因此，在政府和社會越來越依賴互聯(lián)網(wǎng)新聞資源，而網(wǎng)絡新聞可信度現(xiàn)狀又不理想的背景下，本項目從UGC新聞線索認證的實際需求出發(fā)，進行互聯(lián)網(wǎng)UGC新聞內容認證的關鍵技術研究，將具有重要的研究價值。

發(fā)明內容

為了解決上述問題的不足，本發(fā)明提供了基于用戶生成內容的新聞認證預警方法及系統(tǒng)。本發(fā)明的目的是在輸入新聞線索和新聞時間點后實現(xiàn)自動挖掘、判定相關新聞線索的可信度，并且通過可視化的結果展示給用戶豐富、直觀的認證結果、數(shù)據(jù)和證據(jù)。

為達到上述目的，本發(fā)明從互聯(lián)網(wǎng)UGC新聞線索中提取關鍵的認證要素，并從用戶群體，傳播模式和信息內容(多媒體內容、文本內容)等方面對其進行可信度認證的關鍵技術。最終形成UGC新聞真實性的預警分級，為該新聞是否為真實信息提供決策支持。

本發(fā)明提供的一種基于用戶生成內容的新聞認證預警系統(tǒng)，包括：

新聞線索語義擴展模塊，用于獲取新聞線索，并對該新聞線索進行語義擴展，獲取參考數(shù)據(jù)；

參數(shù)數(shù)據(jù)定向采集模塊，用于對該參考數(shù)據(jù)進行定向采集，獲取信息內容、傳輸模式、用戶群體、用戶群體的行為信息和屬性信息；

語義知識提取模塊，從該信息內容中提取語義知識；

語義知識對比認證模塊，對該語義知識進行聚類和相似度計算，識別與歷史新聞線索數(shù)據(jù)庫不匹配的新聞線索；

用戶群體認證模塊，分析用戶群體的行為信息和屬性信息，提取該行為信息和屬性信息的可信度認證要素，獲取該用戶群體的可信度認證結果R(U)；

信息內容認證模塊，用于將信息內容進行邏輯對比認證，將該信息內容反應的情緒、新聞觀點進行分類，獲取該信息內容認證結果R(M)；

傳播模式認證模塊，用于挖掘該新聞觀點的傳播模式，檢測具有異常的傳播模式，獲取該傳播模式異常度認證結果R(G)；

預警分級模塊，用于根據(jù)這些認證結果及其相應的權重，對該新聞線索的可信度進行預警分級。