[發(fā)明專利]一種基于運行環(huán)境特征識別的反爬蟲方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201710203203.4 | 申請日: | 2017-03-30 |
| 公開(公告)號: | CN107426148B | 公開(公告)日: | 2020-07-31 |
| 發(fā)明(設(shè)計)人: | 夏珺崢;蔣平川 | 申請(專利權(quán))人: | 成都優(yōu)易數(shù)據(jù)有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 成都弘毅天承知識產(chǎn)權(quán)代理有限公司 51230 | 代理人: | 李春芳;馬林中 |
| 地址: | 611730 四川省成都市郫縣德源鎮(zhèn)(菁*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 運行 環(huán)境 特征 識別 爬蟲 方法 系統(tǒng) | ||
1.一種反爬蟲方法,其特征在于,包括以下步驟:
步驟1、產(chǎn)生新策略包和用于新策略包運行的選擇碼,利用新策略包更新服務(wù)器當前策略包并構(gòu)建關(guān)于新策略包運行特征數(shù)據(jù)的特征類別白名單;
所述的策略包包括具有不同運行時間程序函數(shù)作為元素的函數(shù)矩陣、用于映射字符串至函數(shù)矩陣中不同元素的選擇子和包含選擇子文本特征的選擇子特征碼;
所述特征數(shù)據(jù)包括程序函數(shù)運行時間數(shù)據(jù);
步驟2、發(fā)送選擇碼至客戶端,然后發(fā)送應(yīng)答請求至客戶端;
步驟3、由客戶端根據(jù)選擇碼選擇地運行策略包的程序函數(shù)進行服務(wù)器應(yīng)答,獲得對應(yīng)選擇碼的特征數(shù)據(jù)并返回特征數(shù)據(jù)至服務(wù)器;
步驟4、分析選擇碼和選擇碼所對應(yīng)的特征數(shù)據(jù),計算出客戶端的特征類別并判斷是否屬于特征類別白名單,對不屬于特征類別白名單的客戶端實施訪問控制;
所述的步驟4,包括以下步驟:
步驟4.1、由存儲模塊在預(yù)定的時間區(qū)間內(nèi)接收特征數(shù)據(jù);
步驟4.2、通過服務(wù)器處理模塊訪問存儲模塊并分析時間區(qū)間內(nèi)的特征數(shù)據(jù),計算出客戶端的特征類別并判斷是否屬于特征類別白名單;
步驟4.2.1、對屬于特征類別白名單的客戶端標記合法,再跳轉(zhuǎn)至步驟1;
步驟4.2.2、對不屬于特征類別白名單的客戶端實施訪問控制。
2.根據(jù)權(quán)利要求1所述的一種反爬蟲方法,其特征在于,所述的步驟1,周期產(chǎn)生新策略包和用于新策略包運行的選擇碼。
3.一種基于運行環(huán)境特征識別的反爬蟲方法,其特征在于,包括以下步驟:
步驟1、在服務(wù)器端周期產(chǎn)生具有不同運行時間程序函數(shù)作為元素的函數(shù)矩陣和用于映射字符串至函數(shù)矩陣中不同元素的選擇子,然后通過哈希算法計算出選擇子的程序文本特征碼作為選擇子特征碼,并設(shè)置運行環(huán)境特征類別的白名單,再通過函數(shù)矩陣更新服務(wù)器的當前函數(shù)矩陣,在服務(wù)器端生成隨機的字符串作為選擇碼,再發(fā)送選擇碼和應(yīng)答請求至客戶端;
步驟2、客戶端根據(jù)接收到的選擇碼、由選擇子選擇出函數(shù)矩陣里的函數(shù)并運行,然后將選擇碼、各函數(shù)運行時間發(fā)送至服務(wù)器;
步驟3、在服務(wù)器端分析選擇碼和運行時間,計算出客戶端運行環(huán)境特征類別,判斷出不屬于白名單內(nèi)運行環(huán)境特征類別的客戶端并對該客戶端實施訪問控制策略。
4.根據(jù)權(quán)利要求3所述的一種基于運行環(huán)境特征識別的反爬蟲方法,其特征在于,所述的步驟1,周期產(chǎn)生包含選擇子文本特征的選擇子特征碼。
5.根據(jù)權(quán)利要求4所述的一種基于運行環(huán)境特征識別的反爬蟲方法,其特征在于,所述的步驟3,包括以下步驟:
步驟3.1、查詢服務(wù)器當前選擇子特征碼,獲得當前使用中的函數(shù)矩陣和用于分析和計算初始設(shè)置的選擇子值;
步驟3.2、選擇出當前函數(shù)矩陣在預(yù)設(shè)時間區(qū)間內(nèi)所有來自客戶端的選擇碼和所對應(yīng)元素的運行時間,通過聚類算法、機器學(xué)習(xí)算法、模式識別算法、深度神經(jīng)網(wǎng)絡(luò)算法計算出客戶端運行環(huán)境特征類別;
步驟3.3、判斷出不屬于白名單內(nèi)運行環(huán)境特征類別的客戶端并對該客戶端標記不合法且實施訪問控制策略。
6.根據(jù)權(quán)利要求3-5中任意一項權(quán)利要求所述的一種基于運行環(huán)境特征識別的反爬蟲方法,其特征在于,所述的步驟3,由服務(wù)器的存儲模塊接收預(yù)設(shè)時間區(qū)間內(nèi)來自客戶端的選擇碼和所對應(yīng)元素的運行時間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都優(yōu)易數(shù)據(jù)有限公司,未經(jīng)成都優(yōu)易數(shù)據(jù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710203203.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測終端和環(huán)境檢測系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計裝置和環(huán)境估計方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測儀(環(huán)境貓)





