[發明專利]反爬蟲方法、裝置及存儲介質有效
| 申請號: | 202011062053.8 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112202784B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 唐舉洪 | 申請(專利權)人: | 成都新潮傳媒集團有限公司 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;G06F16/951 |
| 代理公司: | 成都頂峰專利事務所(普通合伙) 51224 | 代理人: | 王霞 |
| 地址: | 610000 四川省成都市高新*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 爬蟲 方法 裝置 存儲 介質 | ||
1.一種反爬蟲方法,其特征在于,包括:
確定在預設時間內客戶端請求資源的順序,其中,所述資源為基于任一網頁標簽被觸發后而需要請求的至少一個子資源;
確定所述客戶端請求所述至少一個子資源的順序是否為預設順序;
若否,則確定所述客戶端的用戶為爬蟲用戶;
確定所述客戶端請求所述至少一個子資源的順序是否為預設順序,包括:
確定在預設時間內所述客戶端請求所述至少一個靜態資源和所述至少一個動態資源的比例;
若所述至少一個靜態資源和所述至少一個動態資源的比例在預設比例范圍內,確定所述客戶端請求所述至少一個靜態資源的順序是否為第一預設子順序和確定所述客戶端請求所述至少一個動態資源的順序是否為第二預設子順序。
2.根據權利要求1所述的方法,其特征在于,確定在預設時間內客戶端請求資源的順序,包括:
接收客戶端發送的訪問請求,所述訪問請求是用于請求訪問所述任一網頁標簽的內容的請求;
響應所述訪問請求,確定在預設時間內客戶端資源的順序。
3.如權利要求1所述的方法,其特征在于,若所述客戶端請求所述至少一個子資源的順序為所述預設順序,所述方法還包括:
若所述客戶端兩次訪問所述任一網頁標簽的時間間隔小于預設時間間隔,則確定所述客戶端的用戶為爬蟲用戶。
4.如權利要求1所述的方法,其特征在于,若所述客戶端請求所述至少一個子資源的順序為所述預設順序,所述方法還包括:
若所述客戶端在一段時間內,在同一時間點訪問所述任一網頁標簽的次數超過預設次數,則確定所述客戶端的用戶為爬蟲用戶。
5.一種反爬蟲裝置,其特征在于,包括:
第一確定單元,用于確定在預設時間內客戶端請求資源的順序,其中,所述資源為基于任一網頁標簽被觸發后而需要請求的至少一個子資源;
第二確定單元,用于確定所述客戶端請求所述至少一個子資源的順序是否為預設順序;
第三確定單元,用于在所述客戶端請求所述至少一個子資源的順序不是預設順序時,確定所述客戶端的用戶為爬蟲用戶;
第二確定單元在用于確定所述客戶端請求所述至少一個子資源的順序是否為預設順序時,具體用于:
確定在預設時間內所述客戶端請求所述至少一個靜態資源和所述至少一個動態資源的比例;
若所述至少一個靜態資源和所述至少一個動態資源的比例在預設比例范圍內,確定所述客戶端請求所述至少一個靜態資源的順序是否為第一預設子順序和確定所述客戶端請求所述至少一個動態資源的順序是否為第二預設子順序。
6.根據權利要求5所述的反爬蟲裝置,其特征在于,第一確定單元在用于確定在預設時間內客戶端請求資源的順序時,具體用于:
接收客戶端發送的訪問請求,所述訪問請求是用于請求訪問所述任一網頁標簽的內容的請求;
響應所述訪問請求,確定在預設時間內客戶端資源的順序。
7.一種反爬蟲裝置,其特征在于,包括依次通信相連的存儲器、處理器和收發器,其中,所述存儲器用于存儲計算機程序,所述收發器用于收發消息,所述處理器用于讀取所述計算機程序,執行如權利要求1~4任意一項所述的反爬蟲方法。
8.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有指令,當所述指令在計算機上運行時,執行如權利要求1~4任意一項所述的反爬蟲方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都新潮傳媒集團有限公司,未經成都新潮傳媒集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011062053.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種安防監控方法
- 下一篇:一種智能安防監控系統





