[發明專利]一種互聯網新聞事件報道趨勢分析方法及系統有效
| 申請號: | 201210004878.3 | 申請日: | 2012-01-09 |
| 公開(公告)號: | CN103198078A | 公開(公告)日: | 2013-07-10 |
| 發明(設計)人: | 梁汝峰;趙增峰;王松;劉杰;張丹;孫紅娥;楊建武 | 申請(專利權)人: | 北大方正集團有限公司;北京大學;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京天悅專利代理事務所(普通合伙) 11311 | 代理人: | 田明;任曉航 |
| 地址: | 100871 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 互聯網 新聞 事件 報道 趨勢 分析 方法 系統 | ||
技術領域
本發明涉及互聯網信息分析技術領域,具體涉及一種互聯網新聞事件報道趨勢分析方法及系統。
背景技術
互聯網的產生帶來了人類傳播方式的革命性飛躍,正在成為信息社會的基本通信工具。尤其是在重大事件發生時,越來越多的人首先通過互聯網獲取信息、發表看法,互聯網已成為各種信息的集散地和不可忽視的重要輿論陣地。
以北京為例,據初步統計,2011年以前,北京地區互聯網的站點數量已近26萬個;網民人數達402萬人;目前北京地區涉及網絡新聞傳播的網站每天約登載新聞3萬條、更新帖文30萬條、發送手機短信新聞3千條;所有網站每天的頁面瀏覽量達10億頁次、訪問者超過1億人次。
綜上所述,互聯網信息為爆炸式增長,政府、企業、個人各個層面的用戶對互聯網信息越來越關注,同時也希望可以快速、有效地在互聯網中找到所需的信息。主題檢測技術即可實時地從海量信息中分析出主題,這樣用戶便可以通過對主題的瀏覽及分析,從而了解海量信息中的內容。
目前對已知新聞事件發展趨勢的分析方法,一種是通過全文檢索技術實現分析新聞事件的發展趨勢,此種方法無法了解事件的主題信息。另一種是通過主題檢測技術實現,此種方法的數據來源目前都限定在新聞、論壇、博客等信息中,未對數據來源進行進一步的篩選工作,并且也沒有在分析中體現引起主題分裂的關鍵主題,及相關具有代表性的熱點新聞信息。
發明內容
針對現有技術中存在的缺陷,本發明所要解決的技術問題是提供一種互聯網新聞事件報道趨勢分析方法及系統,該方法及系統能夠通過主題及相關報道數量變化展示新聞事件隨時間發展的分布趨勢,并通過主題關系、轉載量及評論數分析分布趨勢中的熱點新聞主題。
為了解決上述技術問題,本發明采用的技術方案如下:
一種互聯網新聞事件報道趨勢分析方法,包括以下步驟:
(1)根據配置的新聞事件的特征信息,實時采集互聯網中新聞信息;
(2)預處理所述新聞信息,篩選出發布時間在設置的新聞事件的統計周期內的新聞信息;
(3)分析篩選出的新聞信息的正文信息,得到新聞信息的主題及主題信息;所述主題包括存在主題信息的主題和不存在主題信息的源主題;
(4)分析當前統計周期與前一統計周期的主題,得出當前統計周期與前一統計周期之間的相同主題以及各相同主題的關聯信息數;
(5)根據所述關聯信息數,得出轉化主題;所述轉化主題是指當前統計周期該相同主題的關聯信息數大于或等于前一統計周期該相同主題的關聯信息數;
(6)獲取設定時間段內的源主題和轉化主題的關聯信息數,并展現源主題和轉化主題的關聯信息數隨時間的分布趨勢。
一種互聯網新聞事件報道趨勢分析系統,包括用于根據新聞事件的特征信息實時采集互聯網中新聞信息的信息采集裝置;
用于篩選出發布時間在設置的新聞事件的統計周期內的新聞信息的數據預處理裝置;
用于分析篩選出的新聞信息的正文信息,得到新聞信息的主題及主題信息的主題檢測裝置;
用于分析并得出當前統計周期與前一統計周期之間的相同主題以及各相同主題的關聯信息數的主題關系分析裝置;
用于根據當前統計周期與前一統計周期之間相同主題的關聯信息數,得出轉化主題的轉化主題分析裝置;
用于獲取并展現設定時間段內源主題和轉化主題的關聯信息數隨時間的分布趨勢的分布趨勢展現裝置。
本發明所述方法及系統,以互聯網信息的信息采集、新聞信息聚類、信息檢索系統為基礎,對已知互聯網中的新聞事件,計算并分析新聞事情的相關新聞主題、相關新聞報道轉載量及其相關評論數,通過主題及相關報道數量變化展示新聞事件隨時間發展的分布趨勢;并通過主題關系、轉載量及評論數分析分布趨勢中熱點新聞的主題,并以圖表方式直觀的展現,使用戶更好地了解、掌握了互聯網新聞事件的傳播規律。
附圖說明
圖1是具體實施方式中互聯網新聞事件報道趨勢分析系統的結構框圖;
圖2是具體實施方式中互互聯網新聞事件報道趨勢分析方法的流程圖。
具體實施方式
下面結合說明書附圖與具體實施方式對本發明做進一步的詳細說明。
如圖1所示,本實施方式中互聯網新聞事件報道趨勢分析系統包括信息采集裝置11、數據預處理裝置12、主題檢測裝置13、主題關系分析裝置14、轉化主題分析裝置15和分布趨勢展現裝置16。其中,數據預處理裝置12包括數據初步篩選模塊121和數據再次篩選模塊122。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京大學;北京北大方正電子有限公司,未經北大方正集團有限公司;北京大學;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210004878.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種對網頁的處理方法及裝置
- 下一篇:一種內存故障自動定位方法及裝置





