[發(fā)明專利]基于用戶生成內容的新聞認證預警方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201410414956.6 | 申請日: | 2014-08-21 |
| 公開(公告)號: | CN104636408B | 公開(公告)日: | 2017-08-08 |
| 發(fā)明(設計)人: | 曹娟;吳波;謝菲;張勇東;蘇宇;李錦濤;呂銳;曹學會 | 申請(專利權)人: | 中國科學院計算技術研究所;新華通訊社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京律誠同業(yè)知識產權代理有限公司11006 | 代理人: | 祁建國,梁揮 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 生成 內容 新聞 認證 預警 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及新聞認證領域,尤其涉及基于用戶生成內容的新聞認證預警方法及系統(tǒng)。
背景技術
隨著互聯(lián)網(wǎng)技術的深入人心和WEB2.0技術的蓬勃發(fā)展,普通用戶成為互聯(lián)網(wǎng)上的內容的主要生產者。UGC(User Generated Content)是用戶生成內容的簡稱,UGC新聞是在社會媒體(例如微博、博客、社交網(wǎng)絡等)中用戶們自發(fā)上傳或分享的新聞事件信息。UGC內容由于其具有反應及時、傳播快等特點,也成為傳統(tǒng)媒體的一個主要信息來源。但是,由于UGC內容的門檻低,任何用戶都可以向互聯(lián)網(wǎng)上傳內容,缺乏對UGC內容的有效監(jiān)管,UGC中存在著大量的虛假新聞,這也給傳統(tǒng)的通訊社在發(fā)布UGC信息帶來困擾。
從國內外研究進展來看,一方面,目前相關的研究主要針對UGC內容(非新聞內容)可信性,或者傳統(tǒng)新聞稿件(非UGC)可信性,建立全面而科學的信息可信度評價指標體系,而針對UGC新聞的研究還處于空白階段;另一方面,這些研究都是從傳播學,心理學,社會學的角度出發(fā),通過問卷調查的方式進行理論分析。而在應用領域針對UGC新聞認證的研究才剛剛起步,暫時還沒有成熟的解決方案。因此,在政府和社會越來越依賴互聯(lián)網(wǎng)新聞資源,而網(wǎng)絡新聞可信度現(xiàn)狀又不理想的背景下,本項目從UGC新聞線索認證的實際需求出發(fā),進行互聯(lián)網(wǎng)UGC新聞內容認證的關鍵技術研究,將具有重要的研究價值。
發(fā)明內容
為了解決上述問題的不足,本發(fā)明提供了基于用戶生成內容的新聞認證預警方法及系統(tǒng)。本發(fā)明的目的是在輸入新聞線索和新聞時間點后實現(xiàn)自動挖掘、判定相關新聞線索的可信度,并且通過可視化的結果展示給用戶豐富、直觀的認證結果、數(shù)據(jù)和證據(jù)。
為達到上述目的,本發(fā)明從互聯(lián)網(wǎng)UGC新聞線索中提取關鍵的認證要素,并從用戶群體,傳播模式和信息內容(多媒體內容、文本內容)等方面對其進行可信度認證的關鍵技術。最終形成UGC新聞真實性的預警分級,為該新聞是否為真實信息提供決策支持。
本發(fā)明提供的一種基于用戶生成內容的新聞認證預警系統(tǒng),包括:
新聞線索語義擴展模塊,用于獲取新聞線索,并對該新聞線索進行語義擴展,獲取參考數(shù)據(jù);
參數(shù)數(shù)據(jù)定向采集模塊,用于對該參考數(shù)據(jù)進行定向采集,獲取信息內容、傳輸模式、用戶群體、用戶群體的行為信息和屬性信息;
語義知識提取模塊,從該信息內容中提取語義知識;
語義知識對比認證模塊,對該語義知識進行聚類和相似度計算,識別與歷史新聞線索數(shù)據(jù)庫不匹配的新聞線索;
用戶群體認證模塊,分析用戶群體的行為信息和屬性信息,提取該行為信息和屬性信息的可信度認證要素,獲取該用戶群體的可信度認證結果R(U);
信息內容認證模塊,用于將信息內容進行邏輯對比認證,將該信息內容反應的情緒、新聞觀點進行分類,獲取該信息內容認證結果R(M);
傳播模式認證模塊,用于挖掘該新聞觀點的傳播模式,檢測具有異常的傳播模式,獲取該傳播模式異常度認證結果R(G);
預警分級模塊,用于根據(jù)這些認證結果及其相應的權重,對該新聞線索的可信度進行預警分級。
所述基于用戶生成內容的新聞認證預警系統(tǒng),還包括:認證結果展示模塊,用于將該用戶群體的可信度認證結果R(U)、該信息內容認證結果R(M)、該傳播模式異常度認證結果R(G)進行整理和結構化展示。
所述基于用戶生成內容的新聞認證預警系統(tǒng),還包括:
該參考數(shù)據(jù)包括新聞線索標簽、源頭微博、以及對應的微博信息鏈接、作者賬號;
該信息內容包括,文本內容和多媒體內容;
該語義知識包含該多媒體和文本語義知識,該多媒體語義知識是指從該多媒體內容中提取高穩(wěn)定性和區(qū)分性的視覺指紋;
該預警分級計算公式為:R={w1R(U)+w2R(G)+w3R(M)},其中w1,w2,w3為權重。
所述基于用戶生成內容的新聞認證預警系統(tǒng),用戶群體認證模塊還包括:
識別模塊,首先在微博平臺中識別與該新聞線索相關的用戶群體;
特性分析模塊,對該用戶群體中的核心人物進行深度分析,總結該核心人物的行為信息和屬性信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所;新華通訊社,未經(jīng)中國科學院計算技術研究所;新華通訊社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410414956.6/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 內容再現(xiàn)系統(tǒng)、內容提供方法、內容再現(xiàn)裝置、內容提供裝置、內容再現(xiàn)程序和內容提供程序
- 內容記錄系統(tǒng)、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統(tǒng)、內容服務器、內容終端及內容服務方法
- 內容分發(fā)系統(tǒng)、內容分發(fā)裝置、內容再生終端及內容分發(fā)方法
- 內容發(fā)布、內容獲取的方法、內容發(fā)布裝置及內容傳播系統(tǒng)
- 內容提供裝置、內容提供方法、內容再現(xiàn)裝置、內容再現(xiàn)方法
- 內容傳輸設備、內容傳輸方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容發(fā)送設備、內容發(fā)送方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容再現(xiàn)裝置、內容再現(xiàn)方法、內容再現(xiàn)程序及內容提供系統(tǒng)
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





