[發明專利]一種數據探測方法及裝置有效
| 申請號: | 202010627728.2 | 申請日: | 2020-07-02 |
| 公開(公告)號: | CN111737629B | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 田啟航;王濱;萬里;畢志城;周少鵬 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/955;G06F16/951 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 楊春香 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 探測 方法 裝置 | ||
1.一種數據探測方法,其特征在于,應用于爬蟲系統,所述爬蟲系統包括爬蟲節點、代理節點,所述數據探測方法包括:
所述代理節點在檢測到數據探測任務時,建立所述代理節點與客戶端的代理關系;
在通過所述爬蟲節點從所述數據探測任務的任務信息中獲取被測系統的根URL地址的情況下,由所述爬蟲節點觸發所述客戶端通過所述代理節點并基于所述根URL地址向被測系統發送請求信息,其中,所述請求信息用于請求獲取所述被測系統的頁面資源,所述被測系統響應所述請求信息向所述客戶端返回頁面資源;
所述代理節點捕獲所述客戶端的請求信息和所述被測系統的頁面資源。
2.根據權利要求1所述的方法,其特征在于,所述爬蟲節點觸發所述客戶端通過所述代理節點基于所述根URL地址向被測系統發送請求信息,包括:
所述爬蟲節點將所述根URL地址作為當前URL地址,觸發所述客戶端通過所述代理節點向所述被測系統發送針對當前URL地址的訪問請求,其中,所述被測系統響應所述針對當前URL地址的訪問請求向客戶端返回所述當前URL地址的頁面資源;
所述爬蟲節點爬取所述頁面資源中包含的URL地址;
所述爬蟲節點檢查爬取的URL地址中是否存在未被訪問過的URL地址;如果是,則選擇任意一個未被訪問過的URL地址作為當前URL地址,返回執行所述觸發所述客戶端通過所述代理節點向被測系統發送針對當前URL地址的訪問請求,直至爬取的URL地址中不存在未被訪問過的URL地址。
3.根據權利要求1所述的方法,其特征在于,所述方法還包括:
所述爬蟲節點爬取所述頁面資源中包含的表單元素;
所述爬蟲節點基于爬取的表單元素觸發所述客戶端通過所述代理節點向所述被測系統發送AJAX請求報文,其中,所述被測系統響應所述AJAX請求報文向所述客戶端返回AJAX響應報文。
4.根據權利要求1所述的方法,其特征在于,在所述爬蟲節點從所述數據探測任務的任務信息中獲取被測系統的根URL地址之前,所述方法還包括:
所述爬蟲節點檢查所述數據探測任務的任務信息中是否存在登錄信息,所述登錄信息包括用戶信息和所述被測系統的登錄頁URL地址;
如果是,則觸發所述客戶端通過所述代理節點向所述被測系統發送針對所述登錄頁URL地址的訪問請求,其中,所述被測系統響應所述針對登錄頁URL地址的訪問請求向所述客戶端返回登錄頁面;
所述爬蟲節點基于所述登錄頁面觸發所述客戶端通過所述代理節點向所述被測系統發送攜帶所述用戶信息的登錄請求,其中,所述被測系統響應所述登錄請求向所述客戶端返回登錄響應消息。
5.根據權利要求4所述的方法,其特征在于,所述爬蟲節點基于所述登錄頁面,觸發所述客戶端通過所述代理節點向所述被測系統發送攜帶所述用戶信息的登錄請求,包括:
所述爬蟲節點基于所述登錄頁面確定所述被測系統所采用的登錄認證方式;
所述爬蟲節點確定與所述被測系統所采用的登錄認證方式匹配的目標登錄方式;
所述爬蟲節點基于所述目標登錄方式在所述登錄頁面上輸入所述用戶信息,并觸發所述客戶端通過所述代理節點向所述被測系統發送攜帶所述用戶信息的登錄請求。
6.一種爬蟲系統,其特征在于,所述爬蟲系統包括爬蟲節點、代理節點;其中:
所述代理節點,用于在檢測到數據探測任務時,建立所述代理節點與客戶端的代理關系;
所述爬蟲節點,用于從所述數據探測任務的任務信息中獲取被測系統的根URL地址的情況下,由所述爬蟲節點觸發所述客戶端通過所述代理節點并基于所述根URL地址向被測系統發送請求信息,其中,所述請求信息用于請求獲取所述被測系統的頁面資源,所述被測系統響應所述請求信息向所述客戶端返回頁面資源所述頁面資源;
所述代理節點,還用于捕獲所述客戶端的請求信息和所述被測系統的頁面資源。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010627728.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種傳動穩定的鏈輪
- 下一篇:一種室間隔穿孔封堵裝置及其使用方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





