[發明專利]一種網絡詞熱度確定方法和裝置有效
| 申請號: | 201110247837.2 | 申請日: | 2011-08-25 |
| 公開(公告)號: | CN102955804A | 公開(公告)日: | 2013-03-06 |
| 發明(設計)人: | 田冬;張遠;吳淑燕 | 申請(專利權)人: | 中國移動通信集團公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 謝安昆;宋志強 |
| 地址: | 100032 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 熱度 確定 方法 裝置 | ||
1.一種網絡詞熱度確定方法,其特征在于,包括:
接收用戶輸入的網絡詞X,獲取包括所述網絡詞X的頁面的頁面地址和發布時間;
根據獲取到的頁面地址計算所述網絡詞X的地域分布參數,根據獲取到的發布時間計算所述網絡詞X的時間分布參數,根據所述地域分布參數和所述時間分布參數計算所述網絡詞X的熱度值,展示給用戶。
2.根據權利要求1所述的方法,其特征在于,
所述接收用戶輸入的網絡詞X之前,進一步包括:建立詞庫和網頁正文索引庫,所述詞庫中保存有一系列的網絡詞;抓取各網站中的頁面的正文內容,保存到所述網頁正文索引庫中,并對應保存每篇正文內容的頁面地址和發布時間,利用所述詞庫中保存的網絡詞對每篇正文內容進行分詞,并用分詞后的正文內容對應替換掉分詞前的正文內容;
所述獲取包括所述網絡詞X的頁面的頁面地址和發布時間包括:從所述網頁正文索引庫中查詢出包括所述網絡詞X的頁面的頁面地址和發布時間。
3.根據權利要求2所述的方法,其特征在于,該方法進一步包括:對所述詞庫和所述網頁正文索引庫中保存的內容進行實時更新。
4.根據權利要求1所述的方法,其特征在于,所述根據獲取到的頁面地址計算所述網絡詞X的地域分布參數,根據獲取到的發布時間計算所述網絡詞X的時間分布參數,根據所述地域分布參數和所述時間分布參數計算所述網絡詞X的熱度值,展示給用戶包括:
將當前時間設置為基準時間T;
計算指定頁面地址中的任意每兩個頁面地址之間的距離之和,將計算結果作為所述地域分布參數,所述指定頁面地址為獲取到的各頁面地址中對應的發布時間位于T-t1~T范圍內的頁面地址,t1為預定時長;
計算指定發布時間中的每個發布時間與T之差的絕對值之和,將計算結果作為所述時間分布參數,所述指定發布時間為獲取到的各發布時間中位于T-t1~T范圍內的發布時間;
根據所述地域分布參數和所述時間分布參數計算所述網絡詞X的熱度值,并展示給用戶。
5.根據權利要求4所述的方法,其特征在于,所述根據所述地域分布參數和所述時間分布參數計算所述網絡詞X的熱度值包括:
計算熱度值
其中,所述r1和r2均為權值,所述Hd為地域分布參數,所述Ht為時間分布參數,所述A為參與本次熱度值計算的頁面地址數,所述B等于t1。
6.根據權利要求3所述的方法,其特征在于,所述根據獲取到的頁面地址計算所述網絡詞X的地域分布參數,根據獲取到的發布時間計算所述網絡詞X的時間分布參數,根據所述地域分布參數和所述時間分布參數計算所述網絡詞X的熱度值,展示給用戶包括:
設置兩個以上基準時間,針對每個基準時間分別計算出一個熱度值,各基準時間均小于或等于當前時間,且各相鄰基準時間之間間隔的時長相同;
根據計算出的各熱度值及其對應的基準時間繪制熱度值變化趨勢圖,并展示給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團公司,未經中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110247837.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種遠程管理日程的方法及系統
- 下一篇:網站訪問方法、系統及終端





