[發明專利]一種熱點信息挖掘方法和系統有效
| 申請號: | 201210079091.3 | 申請日: | 2012-03-23 |
| 公開(公告)號: | CN103324637B | 公開(公告)日: | 2017-12-12 |
| 發明(設計)人: | 姚磊;何軍 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 熱點 信息 挖掘 方法 系統 | ||
技術領域
本發明實施方式涉及互聯網應用技術領域,更具體地,涉及一種熱點信息挖掘方法和系統。
背景技術
隨著計算機技術和網絡技術的飛速發展,互聯網(Internet)在人們的日常生活、學習和工作中發揮的作用也越來越大。人們習慣于通過門戶網站、新聞搜索網站等多種途徑獲知網絡新聞。
網絡新聞是以網絡為載體的新聞,具有快速、多面化、多渠道、多媒體、互動等特點。網絡新聞是突破傳統的新聞傳播概念,在視、聽、感方面給受眾全新的體驗。它將無序化的新聞進行有序的整合,并且大大壓縮了信息的厚度,讓人們在最短的時間內獲得最有效的新聞信息。不僅如此,未來的網絡新聞將不再受傳統新聞發布者的限制,受眾可以發布自己的新聞,并在短時間內獲得更快的傳播,而且新聞將成為人們互動交流的平臺。網絡新聞將隨著人們認識的提高向著更深的層次發展,這將完全顛覆網絡新聞的傳統概念。
目前,大部分門戶網站,或者新聞搜索網站都會選一些熱點信息放在首頁,以引導用戶閱讀。比如,一些門戶網站會將新聞分類,分為國內、國際、娛樂等分類,然后在這些分類中提供熱門新聞以引導用戶閱讀。
然而,這樣的熱點信息一般是通過編輯人工選擇的,或者是綜合若干門戶網站的首頁文章而生成的。這樣的熱點信息的信息推送效率低下,而且信息提供方式浪費人力,而且帶有較大的主觀因素。
同時,在目前現有技術中,新聞的選取范圍只能局限在若干權威網站,因此數據選取范圍比較小,不能保證熱點信息的準確命中率。
發明內容
本發明實施方式提出一種熱點信息挖掘方法,以自動生成熱點信息,從而提高信息推送效率。
本發明實施方式還提出一種熱點信息挖掘系統,以自動生成熱點信息,從而提高信息推送效率。
本發明實施方式的具體方案如下:
一種熱點信息挖掘方法,該方法包括:
根據信息網頁源的訪問次數計算信息網頁源之間的相對熱度值;
根據信息網頁源的相對熱度值計算每個轉載信息在轉載有該轉載信息的信息網頁源中的轉載權重;
對每個轉載信息在各個信息網頁源中的轉載權重進行求和,計算出每個轉載信息的信息熱度值,并按照所述信息熱度值大小順序從所述轉載信息中確定出熱點信息。
一種熱點信息挖掘系統,該系統包括:
相對熱度值計算單元,用于根據信息網頁源的訪問次數計算信息網頁源之間的相對熱度值;
轉載權重計算單元,用于根據信息網頁源的相對熱度值計算每個轉載信息在轉載有該轉載信息的信息網頁源中的轉載權重;
熱點信息確定單元,用于對每個轉載信息在各個信息網頁源中的轉載權重進行求和,計算出每個轉載信息的信息熱度值,并按照所述信息熱度值大小順序從所述轉載信息中確定出熱點信息。
從上述技術方案可以看出,在本發明實施方式中,首先根據信息網頁源的訪問次數計算信息網頁源之間的相對熱度值;然后根據信息網頁源的相對熱度值計算每個轉載信息在轉載有該轉載信息的信息網頁源中的轉載權重;并對每個轉載信息的轉載權重進行求和,計算出每個轉載信息的信息熱度值,再按照信息熱度值的大小順序從轉載信息中確定出熱點信息。由此可見,應用本發明實施方式之后,可以從整個互聯網中基于轉載信息的信息熱度值自動生成熱點信息,因此能夠提高信息推送效率。
附圖說明
圖1為根據本發明實施方式的熱點信息挖掘方法流程示意圖;
圖2為根據本發明實施方式的熱點信息挖掘方法系統示意圖;
圖3為根據本發明實施方式的示范性熱點信息挖掘過程示意圖;
圖4為根據本發明實施方式的轉載信息識別結果示意圖;
圖5為根據本發明實施方式的熱點信息展示示意圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面結合附圖對本發明作進一步的詳細描述。
在本發明實施方式中,以每個信息網頁源作為投票人,以每篇轉載信息作為投票標的物,以每個信息網頁源的熱門程度作為投票的權重。通過綜合計算每篇轉載信息的投票得分,得分多的轉載信息認定為熱點信息,并排在前面,同時,考慮到新聞傳播需要時間,可以用轉載信息的發布時間作為校正因子,校正投票得分,從而得到最后的熱度排名。
圖1為根據本發明實施方式的熱點信息挖掘方法流程示意圖。
如圖1所示,該方法包括:
步驟101:根據信息網頁源的訪問次數計算信息網頁源之間的相對熱度值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210079091.3/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





