[發明專利]資訊篩選推送方法及裝置有效
| 申請號: | 201310590508.7 | 申請日: | 2013-11-20 |
| 公開(公告)號: | CN103559315B | 公開(公告)日: | 2017-01-04 |
| 發明(設計)人: | 張記者 | 申請(專利權)人: | 上海華勤通訊技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/06 |
| 代理公司: | 上海弼興律師事務所31283 | 代理人: | 薛琦,王婧荷 |
| 地址: | 201203 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 資訊 篩選 推送 方法 裝置 | ||
技術領域
本發明涉及一種資訊篩選推送方法及裝置。
背景技術
隨著互聯網的不斷發展和普及,如今人們越來越多通過網絡來了解各類新聞、資訊等,通過網絡獲得資訊可以通過計算機、手機等多種設備來完成。這種新的資訊獲取方式不僅有效利用了網絡傳輸數據的高效以及便捷性,更利用了網絡中的海量資訊來滿足用戶的幾乎任何對于資訊的需求。然而,互聯網上的海量資訊也給用戶帶來了一些負面影響,即用戶在獲取資訊時需要自行進行搜索和篩選,這樣就會浪費時間和網絡流量。而一些網站為此設計的資訊推送方法,則是基于網站方面的統計將一段時間內比較流行的或者點擊率較高的資訊向用戶端自動推送,這種方式盡管一定程度上減少了用戶自行搜索的時間和網絡流量,但對于用戶需求無法進行有效區分,更無法適應于用戶個性化的需求,因而在資訊推送的準確性和效率上仍有明顯不足,即在資訊內容上無法準確高效地匹配于用戶實際想要獲取的資訊。
發明內容
本發明要解決的技術問題是為了克服現有技術中資訊的推送大多需要用戶進行搜索和篩選,而自動推送的資訊又無法適應于個性化的需求,因而篩選推送的資訊的準確性和效率較低的缺陷,提出一種資訊篩選推送方法及裝置。
本發明是通過下述技術方案來解決上述技術問題的:
本發明提供了一種資訊篩選推送方法,其特點在于,將客戶端的瀏覽記錄實時存入一瀏覽記錄池,每條瀏覽記錄包括主題、資訊文本、打開時間和關閉時間,該資訊篩選推送方法還包括以下步驟:
S1、計算每條瀏覽記錄的關閉時間和打開時間的時間間隔,將該時間間隔大于預設的第一間隔的瀏覽記錄作為第一類瀏覽記錄,將該時間間隔小于預設的第二間隔的瀏覽記錄作為第二類瀏覽記錄,其中第一間隔大于第二間隔;
S2、從每條第一類瀏覽記錄中提取主題中的詞組作為第一主題關鍵詞,并記錄至一關鍵詞數據庫中;
S3、從每條第二類瀏覽記錄中提取主題中的詞組作為第二主題關鍵詞,并記錄至該關鍵詞數據庫中;
S4、獲取發布時間距離當前時刻之差小于預設的第三間隔的新資訊;
S5、從新資訊中篩選出主題中包含該關鍵詞數據庫中的至少一第一主題關鍵詞、且不包含該關鍵詞數據庫中的任何第二主題關鍵詞的資訊作為待推送資訊;
S6、將待推送資訊發送至該客戶端。
該資訊篩選推送方法實質上是基于對客戶端過去的瀏覽記錄的分析,從新資訊中篩選出和同一客戶端過去瀏覽的資訊在內容上較相近的資訊進行推送。其中,主題表示這一瀏覽記錄所對應的資訊的標題,資訊文本即資訊的正文內容、打開時間和關閉時間分別為客戶端打開和關閉這條資訊的時間。并且,本領域技術人員容易理解地,這一瀏覽記錄池通常可以設置為僅存儲有最近一段時間內的瀏覽記錄,或者可以設置為其具有一定的容量并在存入新的瀏覽記錄時刪除生成時間最早的瀏覽記錄。
步驟S1中計算得到的某一瀏覽記錄的時間間隔越長,通常說明用戶在這一瀏覽記錄上所花費的時間較長,反之亦然。步驟S1中選取了兩類瀏覽記錄,其中第一類瀏覽記錄的時間間隔較長,第二類瀏覽記錄的時間間隔較短,第二類瀏覽記錄更可能是由于用戶的誤操作而打開的資訊或者是用戶在打開這一資訊后很快發現這一資訊和自己的需求是不一致的,而第一類瀏覽記錄更可能是用戶經仔細閱讀的資訊。因此,將第一類瀏覽記錄作為在資訊篩選中的關鍵詞來源,同時將第二類瀏覽記錄作為資訊篩選中需要排除的關鍵詞來源。為此不僅需要區別這兩類瀏覽記錄,在后續的步驟S2和S3中將從這兩類瀏覽記錄中提取的關鍵詞也進行區別。為了更切合用戶使用習慣來進行瀏覽記錄的區別,第一間隔和第二間隔的具體數值可由本領域技術人員根據統計數據進行設置。
在步驟S5中,根據新資訊的主題對于新資訊進行了篩選,這樣篩選得到的待推送資訊,其內容和用戶過去曾仔細閱讀的資訊較為接近,并且在篩選中排除了用戶誤操作對于分析結果的影響,因而能夠較準確地適應于用戶的實際需求。
較佳地,S2包括以下步驟:
S21、從每條第一類瀏覽記錄中提取主題中的詞組作為第一主題關鍵詞,并記錄至該關鍵詞數據庫中;
S22、計算各個第一主題關鍵詞在該關鍵詞數據庫中的出現次數作為權重值,并在該關鍵詞數據庫中記錄第一主題關鍵詞和權重值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海華勤通訊技術有限公司,未經上海華勤通訊技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310590508.7/2.html,轉載請聲明來源鉆瓜專利網。





