日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于半監(jiān)督的反爬蟲系統(tǒng)及設(shè)計(jì)方法有效

專利信息
申請?zhí)枺?/td> 202010655940.X 申請日: 2020-07-09
公開(公告)號: CN111914905B 公開(公告)日: 2021-07-20
發(fā)明(設(shè)計(jì))人: 簡軍;高熙;蔡月月 申請(專利權(quán))人: 北京人人云圖信息技術(shù)有限公司
主分類號: G06K9/62 分類號: G06K9/62;G06F21/56;G06N20/00
代理公司: 北京中創(chuàng)云知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11837 代理人: 肖佳
地址: 100191 北京市海淀區(qū)北*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 監(jiān)督 爬蟲 系統(tǒng) 設(shè)計(jì) 方法
【說明書】:

發(fā)明公開了一種基于半監(jiān)督的反爬蟲系統(tǒng)及設(shè)計(jì)方法,包括衍生特征向量,無監(jiān)督聚類成簇,專家規(guī)則評估,強(qiáng)化規(guī)則,機(jī)器學(xué)習(xí),輸出識別爬蟲概率結(jié)果;通過無監(jiān)督算法對請求行為進(jìn)行聚類得到不同的簇;通過專家規(guī)則對不同的簇行為進(jìn)行爬蟲概率計(jì)算;對于概率高于某個閾值的行為添加到規(guī)則系統(tǒng)里;對于概率在某個閾值范圍的行為作為維度送進(jìn)機(jī)器學(xué)習(xí)系統(tǒng)進(jìn)行訓(xùn)練和預(yù)測,能夠解決爬蟲行為多變的問題并提高防護(hù)性能,降低誤殺風(fēng)險。

技術(shù)領(lǐng)域

本發(fā)明屬于計(jì)算機(jī)、網(wǎng)絡(luò)數(shù)據(jù)安全和數(shù)據(jù)分析技術(shù)領(lǐng)域,尤其涉及一種基于半監(jiān)督的反爬蟲系統(tǒng)及設(shè)計(jì)方法。

背景技術(shù)

大數(shù)據(jù)時代,網(wǎng)絡(luò)爬蟲的現(xiàn)象與日俱增,網(wǎng)絡(luò)爬蟲的形式和方法也是千變?nèi)f化,有的按照一定的規(guī)則,自動的抓取網(wǎng)頁信息,還有的人為爬取一些用戶信息來用于商業(yè)用途。如此一來,肆意爬取給服務(wù)器造成了很大的壓力,而且不能給該網(wǎng)站帶來新的用戶,造成了很多成本的浪費(fèi)。于是,反爬蟲也越來越受到嚴(yán)峻的挑戰(zhàn)。而現(xiàn)有反爬方法通常采用的分析url路徑,User-Agent,hearders,cookie等字段以及流量統(tǒng)計(jì)來制定規(guī)則做決策,這樣的方式雖然可以起到一定的效果,但是隨著爬取方式的變化,這種反爬蟲方法不能及時發(fā)現(xiàn),仍然不能起到有效的防護(hù)。

發(fā)明內(nèi)容

為了解決上述已有技術(shù)存在的不足,針對變化的爬蟲行為進(jìn)行及時發(fā)現(xiàn)和確定,做到精準(zhǔn)的防護(hù)。本發(fā)明提出一種基于半監(jiān)督的反爬蟲系統(tǒng)及設(shè)計(jì)方法。本發(fā)明的具體技術(shù)方案如下:

一種基于半監(jiān)督的反爬蟲系統(tǒng)設(shè)計(jì)方法,其特征在于,包括以下步驟:

A1:衍生特征向量;基于請求數(shù)據(jù)衍生出需要的特征向量,所述特征向量包含請求的參數(shù)特征和行為特征;

A2:無監(jiān)督聚類成簇;通過無監(jiān)督聚類算法對請求行為聚類得到不同的簇,簇內(nèi)間距低于設(shè)定的第一閾值,簇與簇之間的間距高于設(shè)定的第二閾值;無監(jiān)督聚類算法包括Kmeans、PCA或TSNE中的至少一種;

A3:專家規(guī)則評估;基于現(xiàn)有數(shù)據(jù)和專家經(jīng)驗(yàn),制定符合指標(biāo)要求的專家規(guī)則;通過專家規(guī)則對不同的簇行為計(jì)算爬蟲概率;爬蟲概率高于設(shè)定的第三閾值的行為,經(jīng)過觀察,轉(zhuǎn)化為專家規(guī)則;

A4:強(qiáng)化規(guī)則;對于概率在設(shè)定范圍內(nèi)的請求行為,作為有監(jiān)督的機(jī)器學(xué)習(xí)的輸入維度進(jìn)行訓(xùn)練和預(yù)測;

A5:機(jī)器學(xué)習(xí);

A6:輸出識別爬蟲概率結(jié)果;

進(jìn)一步地,所述步驟A1的具體過程為:

從請求數(shù)據(jù)中提取請求時段,次數(shù),時間間隔,請求內(nèi)容,訪問路徑集合,請求中的cookie,UserAgent和headers所包含的信息;

對這些原始的信息進(jìn)行數(shù)據(jù)的衍生,在衍生的過程中將特征區(qū)分為用戶維度和訪問維度,用戶維度包含用戶設(shè)備、指紋和ip,能夠粗略的標(biāo)識不同用戶的維度;訪問維度包含請求的url、請求的時間、cookie、UserAgent和referer;

將用戶維度和訪問維度交叉組合,聚類衍生,得到數(shù)百個衍生的維度;

計(jì)算衍生的維度的提升度,根據(jù)提升度的分布選擇篩選維度的閾值,篩出有效的維度特征。

進(jìn)一步地,所述步驟A2中的無監(jiān)督聚類算法包括Kmeans、PCA或TSNE中的至少一種,所述步驟A2的具體過程為:

先排查異常點(diǎn)進(jìn)行,異常點(diǎn)包含不符合業(yè)務(wù)邏輯或不符合數(shù)據(jù)分布的點(diǎn);

采用融合聚類方法,融合采用投票方式,通過遍歷簇的個數(shù),尋找輪廓系數(shù)最接近1的分類結(jié)果,且分類結(jié)果需要滿足在兩種以上的聚類算法中,有更多的點(diǎn)的簇類別保持一致。例如:假設(shè)分為兩類簇,用三種聚類算法進(jìn)行投票,對于第一種分類結(jié)果,90%的點(diǎn)的簇類別沒有發(fā)生變化,對于第二種分類結(jié)果,80%的點(diǎn)的簇類別沒有發(fā)生變化,那么認(rèn)為第一種分類結(jié)果更穩(wěn)定可靠。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京人人云圖信息技術(shù)有限公司,未經(jīng)北京人人云圖信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010655940.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品久久久久久久四虎电影| av午夜在线观看| 国产精品久久久久四虎| 波多野结衣巨乳女教师| 久久久一二区| 国产乱一区二区三区视频| 夜夜夜夜夜猛噜噜噜噜噜gg| 国产色一区二区| 日韩中文字幕亚洲欧美| 欧美日韩一卡二卡| 欧美黄色一二三区| 欧美日韩一级二级三级| 99久久国产免费,99久久国产免费大片| 午夜叫声理论片人人影院| 91久久综合亚洲鲁鲁五月天| 国产真实一区二区三区| 国产乱xxxxx97国语对白| 日韩电影在线一区二区三区| 精品国产91久久久| 97人人模人人爽人人喊38tv | 91高清一区| 国产理论片午午午伦夜理片2021| 国产伦精品一区二区三| 精品国产一区在线| 日本精品一二三区| 国91精品久久久久9999不卡| 午夜影院伦理片| 视频一区二区三区中文字幕| 亚洲国产一区二区精华液| 日日夜夜亚洲精品| 在线国产精品一区| 久久99精品国产麻豆婷婷洗澡| 午夜片在线| 精品国产品香蕉在线| 91热精品| 亚洲欧洲一区二区| 日韩亚洲精品在线观看| 午夜国产一区二区| 91久久精品在线| xxxx国产一二三区xxxx| 国产一区二区三区小说| xxxxhd欧美| 91人人精品| 国产一区在线视频观看| 久久不卡一区| 日韩av一二三四区| 国产白丝一区二区三区| 97久久精品人人做人人爽| 91精品高清| 亚洲二区在线播放视频| 午夜免费网址| 国产女人好紧好爽| 欧美日韩精品在线一区| 国产全肉乱妇杂乱视频在线观看| 欧美一区二区三区久久| 日韩精品在线一区二区三区| 欧美日韩亚洲三区| 538国产精品一区二区在线| 国产伦精品一区二区三区免| 国产精品久久免费视频在线| 欧美日韩国产午夜| 91精品一区| 午夜看片网| 日本少妇高潮xxxxⅹ| 久久九九国产精品| 国产一区二区在线观看免费| 午夜电影一区| 久久国产精品精品国产| 国产99久久九九精品| 久久精品亚洲精品| 免费看片一区二区三区| 99国产伦精品一区二区三区| 四虎久久精品国产亚洲av| 国产精品无码专区在线观看| 国产精一区二区| 久久久午夜爽爽一区二区三区三州| 日韩欧美国产高清91| 精品国产亚洲一区二区三区| 97久久国产精品| 国产精品精品视频一区二区三区| 免费的午夜毛片| 欧美精品二区三区| 手机看片国产一区| 91精品久久天干天天天按摩 | 97人人澡人人爽人人模亚洲 | 欧美性xxxxx极品少妇| 91久久国语露脸精品国产高跟 | 91久久精品国产亚洲a∨麻豆| 国产真实一区二区三区| 久久一区二区三区视频| 午夜影院h| 黄色香港三级三级三级| 精品国产乱码一区二区三区在线| 三级午夜片| 亚洲欧美日韩三区| 久久精品综合| 性生交大片免费看潘金莲| 欧美片一区二区| 性国产日韩欧美一区二区在线 | 99re国产精品视频| 欧美一区二区三区四区五区六区| 国产综合久久精品| 色乱码一区二区三区网站| 精品国产一区二区三区四区vr| 亚洲欧美日韩三区| 一级久久久| 日本高清h色视频在线观看| 亚洲精品久久久中文| 激情欧美日韩| 欧美精品久久一区二区| 午夜电影一区| 欧美在线播放一区| 日韩av片无码一区二区不卡电影| 中文字幕一区二区三区不卡| 91国偷自产一区二区介绍| 狠狠色噜噜狠狠狠狠2021天天| 亚洲国产精品国自产拍av| 亚洲欧美一区二区精品久久久| 国产品久久久久久噜噜噜狼狼| 国产淫片免费看| 国产婷婷色一区二区三区在线| 色婷婷精品久久二区二区我来| 国产一区亚洲一区| 国产精品久久久久99| 93精品国产乱码久久久| 日韩三区三区一区区欧69国产| 久久99国产精品视频| 久久99精品久久久久国产越南| 欧美日韩国产91| 欧美日韩一区在线视频| 99久久国产综合精品色伊| 色一情一交一乱一区二区三区| 99欧美精品| 国产精品久久99| 97国产精品久久久| 在线精品视频一区| 91社区国产高清| 亚洲精品少妇一区二区| 日韩av一二三四区| 一区二区欧美精品| 色婷婷久久一区二区三区麻豆 | 久久精品国产亚洲7777| 亚洲精品乱码久久久久久高潮| 国产精品黑色丝袜的老师| 一区二区三区欧美日韩| 国产精品一区二区在线观看| 国产欧美日韩另类| 国产精品视频99| 欧美精品一区二区三区视频| 99精品一区二区| 精品久久9999| 黄色av免费| 日韩av在线播放网址| 欧美一区二区三区性| 国产精品免费观看国产网曝瓜| 少妇高潮大叫喷水| 88国产精品视频一区二区三区| 鲁丝一区二区三区免费观看| 狠狠色噜噜狠狠狠狠| 88国产精品欧美一区二区三区三| 福利电影一区二区三区| 国产农村妇女精品一二区| 国产伦精品一区二区三区电影 | 午夜三级大片| 午夜裸体性播放免费观看| 亚洲国产欧美一区二区三区丁香婷| 国产91丝袜在线熟| 在线观看国产91| 欧美一区二区三区艳史| 国产91电影在线观看| 国产麻豆一区二区| 日本一区二区三区免费播放| 午夜肉伦伦| 国产精品久久亚洲7777| 国产韩国精品一区二区三区 | 久久久久久久久久国产精品| 欧美在线视频三区| 国产精品久久久区三区天天噜| 亚洲国产偷| 国产在线一区二区视频| 色综合久久网| 久久99国产视频| 欧美精品一区二区久久久| 国产欧美一区二区三区免费看 | 四虎国产精品永久在线国在线 | 欧美一级不卡| 国产精品久久久久久久综合| 亚洲三区二区一区| av不卡一区二区三区| 午夜精品99| 国产精品亚洲二区| 猛男大粗猛爽h男人味| 91久久国产露脸精品国产| 久久久综合亚洲91久久98| 欧美激情在线免费| 91精品系列| 欧洲在线一区| 国产视频一区二区不卡| 午夜剧场a级免费| 国产精品午夜一区二区| 欧美日韩精品不卡一区二区三区| 国产精品久久久区三区天天噜| 国产影院一区二区| 好吊妞国产欧美日韩免费观看网站| 国产日产高清欧美一区二区三区 | 国产日韩欧美第一页| 欧美日韩综合一区| 91看黄网站| 久久久久偷看国产亚洲87| 国产午夜精品一区| 午夜老司机电影| 精品国产乱码久久久久久a丨| 91精品综合在线观看| 天堂av色婷婷一区二区三区| 日韩欧美国产第一页| 国产欧美一区二区三区在线播放| 一区二区在线精品| 国产精品欧美久久久久一区二区| 97久久国产亚洲精品超碰热| 国产欧美视频一区二区| 狠狠色狠狠色综合婷婷tag| 亚洲精品国产91| 欧美日韩偷拍一区| 91麻豆文化传媒在线观看| 国产精品电影免费观看| 国产欧美日韩精品在线| 欧美精品五区| 国产精品香蕉在线的人| 国产高清精品一区二区| 亚洲欧洲另类精品久久综合| 7799国产精品久久99| 国内久久久久久| 久久精品视频3| 午夜特级片| 国产在线精品一区二区在线播放| 年轻bbwwbbww高潮| 香蕉免费一区二区三区在线观看| 一区二区三区欧美日韩| 免费看性生活片| 三级视频一区| 一区二区久久精品| 91精品视频在线观看免费| 毛片大全免费观看| 久久黄色精品视频| 久久精品99国产国产| 国产欧美一二三区|