[發明專利]一種爬蟲識別加密串的生成方法、爬蟲識別方法及裝置在審
| 申請號: | 201810044136.0 | 申請日: | 2018-01-17 |
| 公開(公告)號: | CN108429785A | 公開(公告)日: | 2018-08-21 |
| 發明(設計)人: | 王新林 | 申請(專利權)人: | 廣東智媒云圖科技股份有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08;H04L29/06;G06F17/30 |
| 代理公司: | 廣州市越秀區哲力專利商標事務所(普通合伙) 44288 | 代理人: | 羅晶;高淑怡 |
| 地址: | 511458 廣東省廣州市南沙區豐澤東路106*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 爬蟲 加密 緩存 訪問請求 計算機可讀存儲介質 并發送給服務器 讀取 接收服務器 網頁爬蟲 串存儲 誤判 服務器 發送 返回 應用 | ||
1.一種爬蟲識別加密串的生成方法,應用于用戶端,其特征在于包括以下步驟:
接收步驟:當訪問請求為第一次時,接收服務器端返回的加密串并將加密串存儲用戶端的緩存中;
發送步驟:當訪問請求為非第一次時,讀取用戶端的緩存中的加密串并發送給服務器端。
2.如權利要求1所述爬蟲識別加密串的生成方法,其特征在于:所述接收步驟還包括:接收服務器端返回的js代碼,并獲取用戶端的當前時間,然后通過js代碼將用戶端的當前時間與加密串進行二次加密并將其存儲于用戶端的緩存中。
3.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于:所述計算機程序被處理器執行時實現如權利要求1-2中任一項所述的爬蟲識別加密串的生成方法的步驟。
4.一種爬蟲識別方法,應用于服務器端,其特征在于包括以下步驟:
發送加密串步驟:當訪問請求為第一次時,生成加密串并將加密串返回給用戶端;
解密步驟:當訪問請求非第一次時,接收用戶端發送的加密串;
第一判斷步驟:根據加密串是否為服務器生成判斷訪問請求是否正常用戶的訪問請求。
5.如權利要求4所述的方法,其特征在于:還包括:第二判斷步驟:當訪問請求不是正常用戶的訪問請求時,根據用戶代理判斷訪問請求是否為機器爬蟲的訪問請求、或根據相同IP單位時間內用戶發送的訪問請求是否超過預設閾值判斷訪問請求為機器爬蟲的訪問請求。
6.如權利要求5所述的方法,其特征在于:還包括第三判斷步驟:當該訪問請求既不是機器爬蟲的訪問請求,也不是正常用戶的訪問請求時,則該訪問請求為疑似爬蟲的訪問請求。
7.如權利要求6所述的方法,其特征在于:當訪問請求為正常用戶的訪問請求時,將訪問請求發送給用戶服務器;當訪問請求為機器爬蟲的訪問請求時,將訪問請求發送給爬蟲服務器;當訪問請求為疑似爬蟲的訪問請求時,將訪問請求發送給疑似爬蟲服務器。
8.如權利要求4所述的方法,其特征在于:發送加密串步驟還包括:生成js代碼并返回給用戶端,進而通過js代碼獲取用戶端的當前時間,并通過js代碼將用戶端的當前時間與加密串進行二次加密并存儲用戶端的緩存中。
9.如權利要求8所述的方法,其特征在于:所述第一判斷步驟還包括:判斷加密串是否過期,若是,則生成加密串并將加密串返回給客戶端。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于:所述計算機程序被處理器執行時實現如權利要求4-9中任一項所述的爬蟲識別方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東智媒云圖科技股份有限公司,未經廣東智媒云圖科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810044136.0/1.html,轉載請聲明來源鉆瓜專利網。





