[發(fā)明專利]一種網(wǎng)絡(luò)爬蟲識別方法在審

申請?zhí)枺?/td>	202011628116.1	申請日：	2020-12-31
公開（公告）號：	CN112583857A	公開（公告）日：	2021-03-30
發(fā)明（設(shè)計）人：	李茜;阮沐陽;劉慧斯;張桂福	申請（專利權(quán)）人：	湘潭大學
主分類號：	H04L29/06	分類號：	H04L29/06;G06F16/955;G06F16/951
代理公司：	暫無信息	代理人：	暫無信息
地址：	411105 湖南***	國省代碼：	湖南;43
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種網(wǎng)絡(luò) 爬蟲識別方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種網(wǎng)絡(luò)爬蟲識別方法，其特征在于，步驟包括：

S1、設(shè)置黑名單，將已知的爬蟲請求對應(yīng)的源IP地址記錄在黑名單中；

S2、對接收到的請求的源IP地址進行判斷，如果在黑名單中，則將該請求識別為網(wǎng)絡(luò)爬蟲，并執(zhí)行步驟S5；

S3、統(tǒng)計請求次數(shù)，計算請求頻率，如果平均每分鐘內(nèi)請求次數(shù)大于60次，則將該請求識別為網(wǎng)絡(luò)爬蟲，將該請求的源IP加入黑名單，并執(zhí)行步驟S5；

S4、對接收到的請求的URL鏈接進行判斷，如果為特殊設(shè)置的URL則將該請求識別為網(wǎng)絡(luò)爬蟲，并將該請求的源IP加入黑名單；

S5、結(jié)束識別。

2.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)爬蟲識別方法，其特征在于，步驟S2中，進行判斷需要將接收到的請求的源IP地址與黑名單中全部的IP地址進行比對。

3.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)爬蟲識別方法，其特征在于，步驟S3中，計算請求頻率的規(guī)則為用10分鐘內(nèi)請求的總次數(shù)除以10，計算出平均每分鐘內(nèi)請求的次數(shù)。

4.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)爬蟲識別方法，其特征在于，步驟S4中，所述特殊設(shè)置的URL的格式為：a href=“URL_LINK”/a。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湘潭大學，未經(jīng)湘潭大學許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011628116.1/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：席夫堿網(wǎng)絡(luò)聚合物光催化劑及其制備方法和應(yīng)用
下一篇：足底異物探測裝置

同類專利

專利分類

H 電學

H04 電通信技術(shù)
H04L 數(shù)字信息的傳輸，例如電報通信
H04L29-00 H04L 1/00至H04L 27/00單個組中不包含的裝置、設(shè)備、電路和系統(tǒng)
H04L29-02 .通信控制；通信處理
H04L29-12 .以數(shù)據(jù)終端為特征的
H04L29-14 .故障的應(yīng)對措施
H04L29-04 ..用于多條通信線路的
H04L29-06 ..以協(xié)議為特征的

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】