[發明專利]一種網絡輿情漏斗式數據采集分析推送系統及方法在審
| 申請號: | 201410730979.8 | 申請日: | 2014-12-05 |
| 公開(公告)號: | CN104408157A | 公開(公告)日: | 2015-03-11 |
| 發明(設計)人: | 吳雪;黃正強;劉明所 | 申請(專利權)人: | 四川誠品電子商務有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 成都金英專利代理事務所(普通合伙) 51218 | 代理人: | 袁英 |
| 地址: | 610042 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 輿情 漏斗 數據 采集 分析 推送 系統 方法 | ||
技術領域
本發明涉及網絡信息處理技術領域,尤其涉及一種網絡輿情漏斗式數據采集分析推送系統及方法。
背景技術
互聯網在全球范圍內的飛速發展,網絡的開放性和虛擬性,決定了網絡輿情具有以下特點:1、直接性:通過BBS,新聞點評和博客網站,網民可以立即發表意見;下情直接上達,民意表達更加暢通;2、突發性:網絡輿論的形成往往非常迅速,一個熱點事件的存在加上一種情緒化的意見,就可以成為點燃一片輿論的導火索;3、偏差性:由于發言者身份隱蔽,并且缺少規則限制和有效監督,網絡自然成為一些網民發泄情緒的空間;在現實生活中遇到挫折,對社會問題片面認識等等,都會利用網絡得以宣泄。因此在網絡上更容易出現庸俗、灰色的言論。
互聯網上的信息量十分巨大,并且形式多樣,依靠人工巡檢輿情的方法很難應對網上海量信息的收集和處理,并且還浪費人力、物力和時間,從而延誤輿情事件的引導和輿情處置。
發明內容
本發明的目的在于克服現有技術的不足,提供一種網絡輿情漏斗式數據采集分析推送系統及方法,實現“第一時間”“一站式”對各種網絡載體(如新聞、論壇、博客、微博、報刊、電視、搜索引擎)采集的海量數據進行智能分析,穩、準、狠、快地把互聯網讀懂、讀薄。在海量數據中快捷、準確的自動推送用戶真正關心的輿情信息。
本發明的目的是通過以下技術方案來實現的:一種網絡輿情漏斗式數據采集分析推送系統,包括網絡輿情采集模塊、網絡輿情處理模塊和網絡輿情發布模塊,所述網絡輿情采集模塊包括定向精確采集子模塊和非定向采集子模塊,所述定向精確采集子模塊,用于采集新聞、論壇、微博、博客、電子報、網絡電視輿情高發區的媒體類型站點,保證重要信息在第一時間優先采集不丟失;所述非定向采集子模塊,用于采集百度、GOOGLE、360主流搜索引擎數據,進行輿情數據搜索采集補充,保證信息收集的全面性;??????
所述網絡輿情處理模塊包括熱點和敏感話題識別子模塊、主題跟蹤子模塊、自動摘要子模塊和綜合分析子模塊;所述熱點和敏感話題識別子模塊用于根據系統內設置的與我相關、輿情、正負面三大類關鍵詞詞庫識別出給定時間段內的熱門話題、敏感話題以及正負面輿情信息;所述主題跟蹤子模塊用于分析新發表文章、帖子的話題是否與已有主題相同;所述自動摘要子模塊用于對各類主題,各類傾向形成自動摘要;所述綜合分析子模塊,用于根據形成的自動摘要,分析某個主題在不同時段間的關注程度,預測發展趨勢;對突發事件進行跨時間、跨空間綜合分析,獲知事件發生的全貌并預測事件發展的趨勢;
所述網絡輿情發布模塊包括輿情預警子模塊和多維度輿情信息展示子模塊,所述輿情預警子模塊用于對突發事件、涉及內容安全的敏感話題及時發現并報警,所述多維度輿情信息展示子模塊,用于對輿情分析結果形成簡報、報告、圖表,自動推送給用戶。
網絡輿情漏斗式數據采集分析推送方法,包括以下步驟:
(1)網絡輿情采集:對境內外網絡中的新聞網頁、論壇、微博、博客、電子報、網絡電視輿情高發區的媒體類型站點進行定向精確采集,對百度、GOOGLE、360主流搜索引擎數據進行非定向采集,對采集回的信息進行去重、過濾后存入采集數據庫;
(2)網絡輿情處理,包括以下子步驟:
S1、系統對采集數據庫中的數據進行分析,根據與我相關詞庫進行分析是否與我相關,分出與我有關的信息和與我無關的信息;
S2、系統對與我有關的信息進行分析,根據輿情詞庫分析是否屬于輿情信息,分出輿情信息和非輿情信息;
S3、系統對輿情信息進行分析,根據本條輿情信息出處的站點級別數、本條輿情正負關鍵詞級別數、本條輿情數據相似度和相關度進行聚類后的總條數,三個數據相乘積得到本條輿情信息的熱點值,識別出熱點信息和非熱點信息;
S4、系統根據正負面詞庫,采用自然語言智能分詞技術,識別出信息的正負面關系,分出負面信息和非負面信息;所述正負面詞庫包括情感語料庫和正負面輿情詞典;?
S5、系統進行主題跟蹤,分析新發布的文章、帖子等的話題是否與已有的主題相同;對各類主題形成自動摘要;系統將采集回來的信息進行輿情關鍵詞統計分析出輿情關鍵詞的分布情況并進行關鍵詞聚類處理,最后再對文章標題相似度進行綜合分析比較判斷生成相似度關聯數據,從而實現某一事件主題跟蹤分析;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川誠品電子商務有限公司,未經四川誠品電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410730979.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:關鍵詞排名的展示方法和裝置
- 下一篇:一種電子地圖搜索系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





