[發明專利]檢測網頁更新的方法及裝置有效
| 申請號: | 201410709349.2 | 申請日: | 2014-11-27 |
| 公開(公告)號: | CN104391953B | 公開(公告)日: | 2017-12-19 |
| 發明(設計)人: | 馮鴛鶴 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 李志剛,吳貴明 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 網頁 更新 方法 裝置 | ||
1.一種檢測網頁更新的方法,其特征在于,包括:
獲取待檢測網站的歷史訪問記錄,其中,所述歷史訪問記錄包括所述待檢測網站內被訪問過的網頁的訪問記錄;
根據所述歷史訪問記錄確定所述待檢測網站內的歷史訪問網頁;
獲取所述待檢測網站的當前訪問記錄;
根據所述待檢測網站的當前訪問記錄獲取所述待檢測網站內的當前訪問網頁;
獲取所述當前訪問網頁的網頁名稱;
獲取所述當前訪問網頁的網頁名稱對應的數值;
判斷所述當前訪問網頁的網頁名稱對應的數值是否大于預設比較值,其中,如果所述當前訪問網頁的網頁名稱對應的數值不大于所述預設比較值,則確定所述當前訪問網頁不是新增網頁,如果所述當前訪問網頁的網頁名稱對應的數值大于所述預設比較值,則判斷所述當前訪問網頁是否出現在所述歷史訪問網頁中;
如果所述當前訪問網頁出現在所述歷史訪問網頁中,則確定所述當前訪問網頁不是新增網頁;以及
如果所述當前訪問網頁沒有出現在所述歷史訪問網頁中,則確定所述當前訪問網頁是新增網頁。
2.根據權利要求1所述的方法,其特征在于,
在獲取所述待檢測網站的當前訪問記錄之前,所述方法還包括:分別獲取所述歷史訪問網頁的網頁名稱對應的數值,
通過以下方法確定所述預設比較值:
比較所述歷史訪問網頁的網頁名稱對應的數值;
獲取所述歷史訪問網頁的網頁名稱對應的數值中的最大值;以及
確定所述最大值為所述預設比較值。
3.根據權利要求2所述的方法,其特征在于,在確定所述當前訪問網頁是新增網頁之后,所述方法還包括:
確定所述當前訪問網頁的網頁名稱對應的數值為所述預設比較值,或者
確定預設時間間隔;
經過所述預設時間間隔之后,獲取當前時間之前的歷史訪問網頁的網頁名稱對應的數值;
獲取所述當前時間之前的歷史訪問網頁的網頁名稱對應的數值的最大值;以及
確定所述當前時間之前的歷史訪問網頁的網頁名稱對應的數值的最大值為所述預設比較值。
4.根據權利要求1所述的方法,其特征在于,判斷所述當前訪問網頁是否出現在所述歷史訪問網頁中包括:
獲取目標路徑值,其中,所述目標路徑值為所述當前訪問網頁的統一資源定位符中包含的路徑值;
獲取路徑值集合,其中,所述路徑值集合包括所述歷史訪問網頁的統一資源定位符中包含的路徑值;以及
判斷所述目標路徑值是否出現在所述路徑值集合中,
其中,如果所述目標路徑值出現在所述路徑值集合中,則確定所述當前訪問網頁不是新增網頁,如果所述目標路徑值沒有出現在所述路徑值集合中,則確定所述當前訪問網頁是新增網頁。
5.根據權利要求1所述的方法,其特征在于,在確定所述當前訪問網頁是新增網頁之后,所述方法還包括:
統計所述新增網頁的數量;以及
添加所述當前訪問記錄到所述歷史訪問記錄中。
6.一種檢測網頁更新的裝置,其特征在于,包括:
第一獲取單元,用于獲取待檢測網站的歷史訪問記錄,其中,所述歷史訪問記錄包括所述待檢測網站內被訪問過的網頁的訪問記錄;
第一確定單元,用于根據所述歷史訪問記錄確定所述待檢測網站內的歷史訪問網頁;
第二獲取單元,用于獲取所述待檢測網站的當前訪問記錄;
第三獲取單元,用于根據所述待檢測網站的當前訪問記錄獲取所述待檢測網站內的當前訪問網頁;
第四獲取單元,用于獲取所述當前訪問網頁的網頁名稱;
第五獲取單元,用于獲取所述當前訪問網頁的網頁名稱對應的數值;
第二判斷單元,用于判斷所述當前訪問網頁的網頁名稱對應的數值是否大于預設比較值,其中,在所述當前訪問網頁的網頁名稱對應的數值不大于所述預設比較值時,確定所述當前訪問網頁不是新增網頁;
第一判斷單元,用于在所述當前訪問網頁的網頁名稱對應的數值大于所述預設比較值時,判斷所述當前訪問網頁是否出現在所述歷史訪問網頁中;
第二確定單元,用于在所述當前訪問網頁出現在所述歷史訪問網頁中時,確定所述當前訪問網頁不是新增網頁;以及
第三確定單元,用于在所述當前訪問網頁沒有出現在所述歷史訪問網頁中時,確定所述當前訪問網頁是新增網頁。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410709349.2/1.html,轉載請聲明來源鉆瓜專利網。





