[發明專利]一種網絡輿情事件的熱度分析方法及系統在審
| 申請號: | 201310525071.9 | 申請日: | 2013-10-30 |
| 公開(公告)號: | CN104598450A | 公開(公告)日: | 2015-05-06 |
| 發明(設計)人: | 趙增峰;梁汝峰;楊建武 | 申請(專利權)人: | 北大方正集團有限公司;北京大學;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京天悅專利代理事務所(普通合伙) 11311 | 代理人: | 田明;任曉航 |
| 地址: | 100871 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 輿情 事件 熱度 分析 方法 系統 | ||
技術領域
本發明涉及網絡事件熱度分析領域,具體涉及一種網絡輿情事件的熱度分析方法及系統。
背景技術
我國正處在一個社會發展的關鍵時期,而民意歷來都是反映社會形勢的晴雨表,因此通過對民意的透視,可以把握社會發展的關鍵及社會矛盾。隨著互聯網的爆發式發展,網絡成為群眾表達自己心聲和見解的主要渠道,也成為獲取輿情、民意的主要傳播媒介。
目前的計算機技術可實現對網絡信息的熱點聚類,通過把相似信息的聚類,實現熱點的呈現。但是現有方式的熱度的體現只能通過相似信息的數量來衡量,其缺點就是衡量指標單一,從而導致對熱點的判斷出現偏差。
發明內容
針對現有技術中存在的缺陷,本發明的目的在于提供一種網絡輿情事件的熱度分析方法及系統,實現多維度的網絡輿情事件的熱度分析。
為實現上述目的,本發明采用的技術方案如下:
一種網絡輿情事件的熱度分析方法,包括以下步驟:
(1)對所要采集的網站進行數據的采集與保存;
(2)對采集的數據進行聚類分析,將采集的數據分類成不同的話題事件;
(3)根據事件熱點指數計算模型計算每個話題事件的熱點指數。
一種輿情事件的熱度分析系統,包括:
數據采集模塊,用于對所要采集的網站進行數據的采集與保存;
聚類分析模塊,對采集的數據進行聚類分析,將采集的數據分類成不同的話題事件;
熱點指數計算模塊,根據事件熱點指數計算模型計算每個話題事件的熱點指數。
本發明的有益效果在于:本發明所述的方法及系統,對網絡輿情和民意數字化,通過建立多維度的模型及網站權重來計算一個話題的熱點指數,可以更準確的衡量一個事件的熱度情況。
附圖說明
圖1為本發明一種網絡輿情事件的熱度分析系統的結構框圖;
圖2為本發明一種網絡輿情事件的熱度分析方法的流程圖;
圖3為具體實施方式中網絡輿情事件的熱度分析方法的流程示意圖。
具體實施方式
下面結合說明書附圖與具體實施方式對本發明做進一步的詳細說明。
本發明的目的在于提供一種可以較準確反映熱點熱度的指數計算方法及系統,通過多維度的事件熱點指數計算模型及網站權重來計算一個話題的熱點指數。該方法及系統基于數據采集和熱點聚類技術,提供輿情事件的各維度的計算方法和事件熱點指數的計算方法。
圖1示出了本發明一種網絡輿情事件的熱度分析系統的結構框圖,該系統包括了數據采集模塊11、聚類分析模塊12和熱點指數計算模塊13,其中:
數據采集模塊11用于對所要采集的網站進行數據的采集與保存;
聚類分析模塊12對采集的數據進行聚類分析,將采集的數據分類成不同的話題事件;
熱點指數計算模塊13根據事件熱點指數計算模型計算每個話題事件的熱點指數。
數據采集模塊11在需要采集的網站部署采集軟件,對采集范圍內的站點定時的進行數據采集,并對采集到的數據進行入庫保存。聚類分析模塊12對數據模塊采集到的數據進行熱點聚類,通過聚類軟件對采集的數據進行定時的聚類分析,并對同一話題事件的文章進行合并,之后由熱點指數計算模塊13根據事件熱點指數計算模型計算每個話題事件的熱點指數。
所述的事件熱點指數計算模型是根據事件的多維度參數和網站權重建立的計算事件熱度的模型,所述的多維度參數包括數量維度、顯著維度和分布維度。熱點指數計算模塊13根據事件熱點指數計算模型計算每個話題事件的熱點指數的具體方式為:
事件熱點指數=(數量維度值×數量維度權重+顯著維度值×顯著維度權重+分布維度值×分布維度權重)×平均網站權重;
其中,數量維度值=(信息數量得分+總點擊數量得分+總跟帖數量得分)×數量維度權重;
顯著維度值=(網站首頁得分+加精得分+置頂得分+推薦得分)×顯著維度權重;
分布維度值=(網站分布數量得分+網友分布數量得分)×分布維度權重;
網站平均權重為事件所包含的所有文章所在網站的網站權重的均值。
圖2和圖3示出了本實施方式中基于圖1中所示系統的一種網絡輿情事件的熱度分析方法,該方法包括以下步驟:
步驟S21:對所要采集的網站進行數據的采集與保存;
根據需要,部署采集軟件,配置采集的具體網站,對采集范圍內的站點進行定時的數據采集,并對采集數據進行入庫保存。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京大學;北京北大方正電子有限公司;,未經北大方正集團有限公司;北京大學;北京北大方正電子有限公司;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310525071.9/2.html,轉載請聲明來源鉆瓜專利網。





