[發明專利]一種熱點信息挖掘方法和系統有效
| 申請號: | 201210079091.3 | 申請日: | 2012-03-23 |
| 公開(公告)號: | CN103324637B | 公開(公告)日: | 2017-12-12 |
| 發明(設計)人: | 姚磊;何軍 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 熱點 信息 挖掘 方法 系統 | ||
1.一種熱點信息挖掘方法,其特征在于,該方法包括:
根據信息網頁源的訪問次數計算信息網頁源之間的相對熱度值;
根據信息網頁源的相對熱度值計算每個轉載信息在轉載有該轉載信息的信息網頁源中的轉載權重;其中,信息網頁源的相對熱度值越高,轉載信息在所述信息網頁源的轉載權重越大;
對每個轉載信息在各個信息網頁源中的轉載權重進行求和,計算出每個轉載信息的信息熱度值,并按照所述信息熱度值大小順序從所述轉載信息中確定出熱點信息。
2.根據權利要求1所述的熱點信息挖掘方法,其特征在于,該方法進一步包括:根據每個轉載信息的發布時間確定時間因子,并利用所述時間因子對每個所述信息熱度值進行修正。
3.根據權利要求1所述的熱點信息挖掘方法,其特征在于,該方法進一步包括:基于文本特征的相似度算法從各個信息網頁源中確定出所述轉載信息。
4.根據權利要求1所述的熱點信息挖掘方法,其特征在于,
所述根據信息網頁源的訪問次數計算信息網頁源之間的相對熱度值為:
針對第k個信息網頁源,計算其相對熱度值SiteHotnessk,其中:
其中norm為歸一化系數;AccessCountk為第k個信息網頁源的訪問次數,K為所有信息網頁源的集合。
5.根據權利要求1所述的熱點信息挖掘方法,其特征在于,所述計算信息熱度值包括:
針對第i個轉載信息,計算其信息熱度值NewsHotnessi;
CitationHotnessk=g(SiteHotnessk);
其中K是所有轉載過該第i個轉載信息的信息網頁源的集合;PublishTime為該第i個轉載信息的發布時間;f(PublishTime)為關于PublishTime的時間調權函數,CitationHotnessk為該第i個轉載信息在第k個轉載有該轉載信息的信息網頁源中的轉載權重,g(SiteHotnessk)是關于SiteHotnessk的熱度調權函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210079091.3/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





