[發明專利]網頁改版的監控方法及裝置有效
| 申請號: | 201610045870.X | 申請日: | 2016-01-22 |
| 公開(公告)號: | CN106997353B | 公開(公告)日: | 2021-08-10 |
| 發明(設計)人: | 張祎博;蘭光明 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/958 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁 改版 監控 方法 裝置 | ||
1.一種網頁改版的監控方法,其特征在于,包括:
為內容頁鏈接地址對應的內容頁中不同區域的內容配置固定結構標識;
根據預設時間間隔獲取待監控網站的網頁鏈接地址;其中,預設時間間隔為小于兩次網站爬取程序運行的時間間隔;
檢測待監控網站的網頁鏈接地址是否存在變化;所述檢測待監控網站的網頁鏈接地址是否存在變化,包括:通過Xpath提取網頁鏈接地址的路徑信息,再利用正則表達式方法進行匹配;
若不存在,則判斷所述網頁鏈接地址個數是否符合預設范圍;
若否,則確定所述待監控網站的網頁存在改版;
若是,則提取所述待監控網站中內容頁鏈接地址對應網頁的固定結構標識,檢測所述固定結構標識是否存在變化;
若是,則確定所述待監控網站的網頁存在改版。
2.根據權利要求1所述的網頁改版的監控方法,其特征在于,所述監控網站的網頁鏈接地址包括網站的目錄頁鏈接地址和內容頁鏈接地址。
3.根據權利要求2所述的網頁改版的監控方法,其特征在于,所述若判斷所述網頁鏈接地址個數不符合預設范圍,則確定所述待監控網站的網頁存在改版包括:
若所述目錄頁鏈接地址個數不符合預設范圍,則確定所述待監控網站的網頁存在改版;和/或
若所述內容頁鏈接地址個數符合預設范圍,則提取所述待監控網站中內容頁鏈接地址對應網頁的固定結構標識,檢測所述固定結構標識是否存在變化,若是,則確定所述待監控網站的網頁存在改版。
4.一種網頁改版的監控裝置,其特征在于,包括:
配置單元,用于為內容頁鏈接地址對應的內容頁中不同區域的內容配置固定結構標識;
檢測單元,用于檢測待監控網站的網頁鏈接地址是否存在變化;所述檢測待監控網站的網頁鏈接地址是否存在變化,包括:通過Xpath提取網頁鏈接地址的路徑信息,再利用正則表達式方法進行匹配;
判斷單元,用于若檢測單元檢測出待監控網站的網頁鏈接地址不存在變化,則判斷所述網頁鏈接地址個數是否符合預設范圍;
若是,則提取所述待監控網站中內容頁鏈接地址對應網頁的固定結構標識,檢測所述固定結構標識是否存在變化;
若是,則確定所述待監控網站的網頁存在改版;
確定單元,用于若判斷單元判斷出所述網頁鏈接地址個數不符合預設范圍,則確定所述待監控網站的網頁存在改版;
其中,所述裝置還包括:
獲取單元,用于根據預設時間間隔獲取待監控網站的網頁鏈接地址。
5.根據權利要求4所述的網頁改版的監控裝置,其特征在于,所述監控網站的網頁鏈接地址包括網站的目錄頁鏈接地址和內容頁鏈接地址。
6.根據權利要求5所述的網頁改版的監控裝置,其特征在于,
所述確定單元 ,具體用于若判斷單元判斷出所述目錄頁鏈接地址個數不符合預設范圍,則確定所述待監控網站的網頁存在改版;和/或
所述確定單元 ,具體用于若判斷單元判斷出所述內容頁鏈接地址個數符合預設范圍,則提取所述待監控網站中內容頁鏈接地址對應網頁的固定結構標識,檢測所述固定結構標識是否存在變化,若是,則確定所述待監控網站的網頁存在改版。
7.一種存儲介質,其特征在于,所述存儲介質包括存儲的程序,其中,在所述程序運行時控制所述存儲介質所在設備執行權利要求1至權利要求3中任意一項所述的網頁改版的監控方法。
8.一種處理器,其特征在于,所述處理器用于運行程序,其中,所述程序運行時執行權利要求1至權利要求3中任一項所述的網頁改版的監控方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610045870.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:建筑施工用塔吊及范圍可調式噴淋除塵系統
- 下一篇:一種新型噴淋吸收塔





