日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]面向廣告投放的主從分布內(nèi)容爬取機(jī)器人在審

專利信息
申請(qǐng)?zhí)枺?/td> 202110971084.3 申請(qǐng)日: 2021-08-23
公開(kāi)(公告)號(hào): CN113656673A 公開(kāi)(公告)日: 2021-11-16
發(fā)明(設(shè)計(jì))人: 劉文平 申請(qǐng)(專利權(quán))人: 劉文平
主分類號(hào): G06F16/951 分類號(hào): G06F16/951;G06F16/955;G06K9/62;G06Q30/02
代理公司: 暫無(wú)信息 代理人: 暫無(wú)信息
地址: 312400 浙*** 國(guó)省代碼: 浙江;33
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 面向 廣告 投放 主從 分布 內(nèi)容 機(jī)器人
【權(quán)利要求書(shū)】:

1.面向廣告投放的主從分布內(nèi)容爬取機(jī)器人,其特征在于,設(shè)計(jì)實(shí)現(xiàn)基于Redis的分布式內(nèi)容爬取機(jī)器人,通過(guò)分布式網(wǎng)絡(luò)部署方式進(jìn)行抓取與存儲(chǔ);分布式內(nèi)容爬取機(jī)器人總體架構(gòu)包括一個(gè)中樞調(diào)度器、多個(gè)爬取器結(jié)點(diǎn)、Web配置管理模塊、代理池模塊、分布式存儲(chǔ)模塊、Redis數(shù)據(jù)庫(kù)與MongoDB數(shù)據(jù)庫(kù),具體為:

第一,基于廣告投放的實(shí)際需求,提出一個(gè)主從分布內(nèi)容爬取機(jī)器人來(lái)索引網(wǎng)頁(yè)信息并進(jìn)行周期性更新,構(gòu)建訓(xùn)練集與測(cè)試集,實(shí)現(xiàn)廣告投放頁(yè)面的快速響應(yīng);

第二,內(nèi)容爬取機(jī)器人由一個(gè)中樞調(diào)度器和眾多抓取爬蟲(chóng)組成,并基于Web方式實(shí)現(xiàn)抓取規(guī)則配置與運(yùn)行狀態(tài)實(shí)時(shí)監(jiān)測(cè),中樞調(diào)度器與爬蟲(chóng)結(jié)點(diǎn)間采用Redis內(nèi)存數(shù)據(jù)庫(kù)實(shí)現(xiàn)雙向通信,其中中樞調(diào)度器采用多級(jí)URL隊(duì)列實(shí)現(xiàn)URL規(guī)則匹配與去重操作,同時(shí)周期性監(jiān)測(cè)抓取規(guī)則變化進(jìn)行規(guī)則重調(diào)度,并根據(jù)配置調(diào)節(jié)各個(gè)規(guī)則隊(duì)列調(diào)度速率并通過(guò)一致性哈希算法在多個(gè)抓取爬蟲(chóng)間進(jìn)行任務(wù)均衡;另外,每個(gè)抓取爬蟲(chóng)采用多線程池設(shè)計(jì)來(lái)并發(fā)請(qǐng)求URL,先提取頁(yè)面鏈接,再采用開(kāi)源Goose模塊提取元數(shù)據(jù)與正文內(nèi)容后,采用分片與復(fù)制集機(jī)制對(duì)內(nèi)容進(jìn)行分布式存儲(chǔ),同時(shí)使用代理IP來(lái)防止網(wǎng)站屏蔽內(nèi)容爬取機(jī)器人。

2.根據(jù)權(quán)利要求1所述的面向廣告投放的主從分布內(nèi)容爬取機(jī)器人,其特征在于,主從分布內(nèi)容爬取機(jī)器人基本運(yùn)行流程為:首先啟動(dòng)MongoDB分布式數(shù)據(jù)庫(kù)與Redis數(shù)據(jù)庫(kù),確認(rèn)兩者正常運(yùn)行,然后啟動(dòng)Web配置管理模塊Flask監(jiān)聽(tīng)本地5000端口,將針對(duì)特定站點(diǎn)指定的抓取規(guī)則依次配置存儲(chǔ)到Redis數(shù)據(jù)庫(kù),再啟動(dòng)中樞調(diào)度器,調(diào)度器首先加載系統(tǒng)配置文件到全局,加載規(guī)則更新線程,該線程從Redis中讀取事先制定的抓取規(guī)則到全局字典并更新規(guī)則版本信息,該線程創(chuàng)建調(diào)度線程并啟動(dòng)它,周期性動(dòng)態(tài)監(jiān)測(cè)規(guī)則版本號(hào),發(fā)現(xiàn)規(guī)則變動(dòng)就激活調(diào)度標(biāo)志通知調(diào)度線程立即開(kāi)始一次新的調(diào)度,調(diào)度線程在一次調(diào)度進(jìn)程中進(jìn)行兩個(gè)進(jìn)程:規(guī)則初始調(diào)度與規(guī)則隊(duì)列均衡調(diào)度,其中規(guī)則初始調(diào)度根據(jù)是否達(dá)到更新周期,由規(guī)則種子列表驅(qū)動(dòng)一次更新性調(diào)度,規(guī)則隊(duì)列調(diào)度根據(jù)各個(gè)隊(duì)列在配置中的優(yōu)先級(jí)與權(quán)重確定其調(diào)度速率后,去重并更新其調(diào)度狀態(tài),由一致性哈希進(jìn)程投入當(dāng)前存活爬取器的調(diào)度隊(duì)列;代理池啟動(dòng)后負(fù)責(zé)周期性獲取互聯(lián)網(wǎng)實(shí)時(shí)代理IP信息有效性檢測(cè)后投入Redis;爬取器啟動(dòng)后,加載多個(gè)線程單元從對(duì)應(yīng)的調(diào)度隊(duì)列中加載URL交給下載組件,下載后提取URL回饋給調(diào)度器,頁(yè)面放入數(shù)據(jù)隊(duì)列等待存儲(chǔ)模塊的處理,最后啟動(dòng)存儲(chǔ)模塊將頁(yè)面預(yù)處理后提取有效信息,存入分布式數(shù)據(jù)庫(kù)MongoDB中,同時(shí)通過(guò)FlaskWeb后臺(tái)監(jiān)測(cè)系統(tǒng)運(yùn)行狀態(tài);各個(gè)組件間相互獨(dú)立,都可以部署在不同的機(jī)器結(jié)點(diǎn)上,實(shí)現(xiàn)資源有效利用。

3.根據(jù)權(quán)利要求1所述的面向廣告投放的主從分布內(nèi)容爬取機(jī)器人,其特征在于,中樞調(diào)度器的設(shè)計(jì):中樞調(diào)度類由規(guī)則更新線程類與規(guī)則調(diào)度線程類組成,三者共同依托環(huán)境類來(lái)工作,環(huán)境類提供全局運(yùn)行字典變量,存儲(chǔ)實(shí)時(shí)的抓取規(guī)則和一些全局共享的變量信息,還提供Redis數(shù)據(jù)庫(kù)連接池變量,該工作類定義兩個(gè)靜態(tài)方法:

第一方法:鏈接檢測(cè)方法進(jìn)行鏈接狀態(tài)調(diào)度邏輯,同時(shí)執(zhí)行實(shí)際調(diào)度操作,對(duì)未出現(xiàn)過(guò)的鏈接創(chuàng)建新的URL對(duì)象類,判斷已有URL對(duì)象的當(dāng)前狀態(tài),如果是爬行失敗狀態(tài)則根據(jù)調(diào)度記錄表統(tǒng)計(jì)參與調(diào)度與調(diào)度失敗的次數(shù),如果次數(shù)超過(guò)設(shè)定值則放棄該URL的抓取,否則在調(diào)度時(shí)間間隔滿足時(shí),給予又一次參與調(diào)度的機(jī)會(huì),在當(dāng)前狀態(tài)不為失敗時(shí),如果其當(dāng)前狀態(tài)是爬行中或者已調(diào)度,則放棄這次調(diào)度,如果當(dāng)前狀態(tài)為爬行成功且URL的類型為分支,基于分支結(jié)點(diǎn)內(nèi)容變化較快,立即對(duì)它進(jìn)行調(diào)度,剩余的所有情況則在滿足時(shí)間間隔的條件下進(jìn)行調(diào)度;

第二方法:基于哈希的去重功能,同時(shí)更新URL對(duì)象信息。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于劉文平,未經(jīng)劉文平許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110971084.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū);

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 日本一区二区免费电影| 李采潭无删减版大尺度| 久久天堂国产香蕉三区| 国产精品日韩高清伦字幕搜索| 欧美高清性xxxx| 精品欧美一区二区精品久久小说| 国产三级在线视频一区二区三区| 久久99久久99精品免观看软件| 久久99国产精品视频| 波多野结衣女教师30分钟| 国产日韩精品一区二区| 久久99国产精品久久99果冻传媒新版本| 一区二区不卡在线| 欧美激情片一区二区| 狠狠色噜噜狠狠狠狠黑人| 欧美日韩一区二区三区精品| 久久99精品久久久久国产越南| 国产精品久久久久久亚洲美女高潮| 国产99久久九九精品免费| 欧美高清视频一区二区三区| 夜夜嗨av色一区二区不卡| 欧美高清视频一区二区三区| 丝袜美腿诱惑一区二区| 国产在线欧美在线| 国产乱对白刺激在线视频| 理论片午午伦夜理片在线播放| 日韩av中文字幕在线免费观看| 日韩中文字幕在线一区| 国产精品一区亚洲二区日本三区| 狠狠色噜噜综合社区| 国内精品久久久久影院日本 | 国产1区2区视频| 欧美一区二区伦理片| 亚洲精品国产setv| 激情久久一区二区| 中文字幕一区二区三区乱码视频 | 国产精品久久久久久久妇女| 日本精品视频一区二区三区| 色婷婷精品久久二区二区6| 在线国产91| 国产精品69av| xxxx在线视频| 日韩av在线播放网址| 日本一区午夜艳熟免费| 999亚洲国产精| 福利片一区二区三区| 久久aⅴ国产欧美74aaa| 亚洲精品中文字幕乱码三区91| 亚洲乱码一区二区| 亚洲精品国产一区| 丰满少妇在线播放bd日韩电影| 国产1区2| 伊人久久婷婷色综合98网| 黄毛片在线观看| 浪潮av色| 色综合久久网| 国产精品一区在线观看 | 奇米色欧美一区二区三区| 伊人久久婷婷色综合98网| 亚洲国产视频一区二区三区| 亚洲在线久久| 日韩欧美高清一区| 欧美日韩一二三四区| 日本精品视频一区二区三区| 夜夜夜夜夜猛噜噜噜噜噜gg| 国91精品久久久久9999不卡| 精品国产九九| 亚洲高清久久久| 久久久久国产精品www| 乱子伦农村| 91偷拍网站| 日韩女女同一区二区三区| 狠狠躁夜夜躁xxxxaaaa| 国产69精品久久久久孕妇不能看| 国产99久久九九精品| 午夜肉伦伦| 欧美一区二区免费视频| 精品国产一区二区三区久久久久久| 激情久久久| 夜夜躁狠狠躁日日躁2024| 91一区二区三区视频| 日韩区欧美久久久无人区| 精品a在线| 国产一区二区精品在线| 久久精品男人的天堂| 日本午夜一区二区| 欧美乱妇高清无乱码免费| 奇米色欧美一区二区三区| 97人人澡人人添人人爽超碰| 国产精品国产三级国产aⅴ下载| 肥大bbwbbwbbw高潮| 国产在线不卡一| 欧美三级午夜理伦三级中视频| 伊人精品一区二区三区| 夜夜夜夜夜猛噜噜噜噜噜gg| 强制中出し~大桥未久4| 日韩欧美一区二区久久婷婷| 91黄在线看| 色乱码一区二区三在线看| 天天干狠狠插| 中文字幕日韩有码| 国产在线不卡一区| 中文字幕一区一区三区| 欧美高清性xxxxhdvideos| 亚洲自拍偷拍一区二区三区| 久久精品国产亚洲一区二区| 日韩精品一区三区| 91精品视频免费在线观看| 少妇厨房与子伦免费观看| 国语对白一区二区| 久久99久国产精品黄毛片入口 | 十八无遮挡| 国产91在线拍偷自揄拍| 玖玖精品国产| 国产精品欧美一区二区三区奶水 | www.久久精品视频| 精品少妇一区二区三区免费观看焕| 中文字幕精品一区二区三区在线| 国产精品亚发布| 欧美一区二区三区在线免费观看| 亚洲午夜天堂吃瓜在线| 亚洲精品久久久久www| 亚洲精品乱码久久久久久高潮| 久久久久国产一区二区三区不卡| 欧美一级久久精品| 欧美精品一区二区性色| 久久福利视频网| 999亚洲国产精| 午夜免费av电影| 国产视频二区在线观看| 精品香蕉一区二区三区| 综合在线一区| 欧美日韩一级黄| 99久久国产综合| 国产高清在线一区| 99久久婷婷国产综合精品草原| 久久伊人色综合| 日韩av在线高清| 国产精品欧美久久| 一级午夜影院| 羞羞免费视频网站| 中文在线一区| 国产99久久九九精品免费| 午夜一区二区视频| 欧美午夜羞羞羞免费视频app | 国产精品99一区二区三区| 亚洲va久久久噜噜噜久久0| 99精品一区| 福利片91| 国产视频一区二区不卡| 性视频一区二区三区| 免费视频拗女稀缺一区二区| 一区二区三区欧美在线| 蜜臀久久99静品久久久久久| 欧美xxxxxhd| 国产欧美精品一区二区三区小说| 香蕉久久国产| 欧美精品久久一区| 91视频国产一区| 国产精品久久久久99| 中文字幕一区二区三区日韩精品| 亚洲精品卡一| 日本一区二区三区免费视频| 国产日韩欧美一区二区在线观看| 午夜激情免费电影| 欧美精品中文字幕亚洲专区| 国产欧美综合一区| 国产品久久久久久噜噜噜狼狼| 日韩精品一区二区久久| 九九精品久久| 国产精品伦一区二区三区级视频频| 亚洲国产美女精品久久久久∴| 久久免费视频99| 欧美一区二区伦理片| 国产精品久久久爽爽爽麻豆色哟哟| 猛男大粗猛爽h男人味| 国产日韩欧美综合在线| 欧美日韩一区二区三区四区五区| 亚洲乱亚洲乱妇28p| 日韩区欧美久久久无人区| 国偷自产中文字幕亚洲手机在线 | 狠狠躁夜夜| 精品综合久久久久| 精品国产91久久久久久久| 日本一区二区三区免费在线| 国产视频一区二区不卡| 国产色99| 国产精品v欧美精品v日韩精品v| 日韩精品一区二区三区在线| 欧美精品免费视频| 国产99久久久久久免费看| 欧美日韩亚洲三区| 中文字幕av一区二区三区四区| 国产精品不卡一区二区三区| 性色av色香蕉一区二区| 午夜一区二区视频| 国产电影一区二区三区下载| 国产欧美一二三区| 91麻豆国产自产在线观看hd | 久久国产精品二区| 一区二区三区欧美在线| 蜜臀久久99精品久久一区二区| 国产免费第一区| 91麻豆精品国产自产欧美一级在线观看 | 午夜一区二区三区在线观看| 欧美激情片一区二区| 国产一区二区三区大片| 性欧美1819sex性高播放| av素人在线| 久久天天躁夜夜躁狠狠躁2022| 国产69精品久久99不卡解锁版| 国产精品久久久视频| 精品久久香蕉国产线看观看gif| 久久精品亚洲一区二区三区画质| 欧美乱妇高清无乱码免费| 欧美一级日韩一级| 欧美日韩亚洲国产一区| 日韩av在线影视| 黄色国产一区二区| 久久国产精品精品国产| 国产大片黄在线观看私人影院| 色吊丝av中文字幕| 精品香蕉一区二区三区| 国产91丝袜在线熟| 狠狠色综合久久丁香婷婷| 久久精品国产精品亚洲红杏| 国产精品69av| 久久亚洲综合国产精品99麻豆的功能介绍| 国产品久精国精产拍| 草逼视频网站| 国产伦理一区| 国产一区二区视频播放| 亚洲乱亚洲乱妇28p| 日本高清一二三区| 欧美日韩国产区| 欧美日韩精品中文字幕| 国产麻豆精品久久| 国产1区2区3区| 午夜av片| 午夜爽爽爽男女免费观看| 国产目拍亚洲精品区一区| 美国三级日本三级久久99| 久久99精品久久久噜噜最新章节| 91黄在线看 | 久久久久国产精品www| 午夜激情电影院|