日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]控制網(wǎng)絡(luò)爬蟲的任務(wù)分配方法和裝置有效

專利信息
申請(qǐng)?zhí)枺?/td> 201610243866.4 申請(qǐng)日: 2016-04-18
公開(公告)號(hào): CN107305548B 公開(公告)日: 2020-02-28
發(fā)明(設(shè)計(jì))人: 楊杰 申請(qǐng)(專利權(quán))人: 北京國雙科技有限公司
主分類號(hào): G06F16/951 分類號(hào): G06F16/951
代理公司: 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 代理人: 韓建偉;張永明
地址: 100083 北京市海淀區(qū)*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 控制 網(wǎng)絡(luò) 爬蟲 任務(wù) 分配 方法 裝置
【說明書】:

本申請(qǐng)公開了一種控制網(wǎng)絡(luò)爬蟲的任務(wù)分配方法和裝置。其中,網(wǎng)絡(luò)爬蟲采用多線程執(zhí)行任務(wù),多線程預(yù)先存放于線程池內(nèi),該方法包括:通過信號(hào)量判斷多線程中的任務(wù)線程的數(shù)量是否達(dá)到任務(wù)最大并行數(shù),其中,信號(hào)量的初始值為任務(wù)最大并行數(shù),任務(wù)線程為經(jīng)過信號(hào)量的線程;在通過信號(hào)量判斷出多線程中的任務(wù)線程的數(shù)量達(dá)到任務(wù)最大并行數(shù)時(shí),阻止線程池內(nèi)的線程從URL隊(duì)列中獲取任務(wù);以及在通過信號(hào)量判斷出多線程中的任務(wù)線程的數(shù)量未達(dá)到任務(wù)最大并行數(shù)時(shí),控制線程池內(nèi)的線程從URL隊(duì)列中獲取任務(wù)。本申請(qǐng)解決了相關(guān)技術(shù)中通過中間控制器分配網(wǎng)絡(luò)爬蟲任務(wù)導(dǎo)致爬蟲系統(tǒng)變得較為復(fù)雜的技術(shù)問題。

技術(shù)領(lǐng)域

本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種控制網(wǎng)絡(luò)爬蟲的任務(wù)分配方法和裝置。

背景技術(shù)

網(wǎng)絡(luò)爬蟲爬取網(wǎng)頁時(shí)會(huì)從一個(gè)或若干初始網(wǎng)頁的統(tǒng)一資源定位符(UniformResource Locator,簡稱為URL)開始,抽取初始網(wǎng)頁上的所有URL,并放入U(xiǎn)RL隊(duì)列,等待網(wǎng)絡(luò)爬蟲從URL隊(duì)列獲取一個(gè)新的URL繼續(xù)執(zhí)行網(wǎng)頁爬取。現(xiàn)有方法是通過中間控制器來給網(wǎng)絡(luò)爬蟲分配任務(wù),所以網(wǎng)絡(luò)爬蟲任務(wù)的分配非常依賴于中間控制器,當(dāng)中間控制器出現(xiàn)異常情況時(shí)會(huì)導(dǎo)致網(wǎng)絡(luò)爬蟲分配不到任務(wù)或者分配過多任務(wù),如果網(wǎng)絡(luò)爬蟲分配不到任務(wù)就會(huì)一直處于空閑狀態(tài),浪費(fèi)機(jī)器資源;如果網(wǎng)絡(luò)爬蟲同時(shí)執(zhí)行過多的任務(wù)則會(huì)導(dǎo)致網(wǎng)絡(luò)爬蟲崩潰,造成任務(wù)和數(shù)據(jù)的丟失,帶來較為嚴(yán)重的后果。

具體地,現(xiàn)有通過中間控制器分配網(wǎng)絡(luò)爬蟲任務(wù)的方法存在如下缺點(diǎn):首先,需要另寫一個(gè)中間控制器程序分配網(wǎng)絡(luò)爬蟲的爬取任務(wù),使得整個(gè)爬蟲系統(tǒng)變得復(fù)雜,不易維護(hù);其次,網(wǎng)絡(luò)爬蟲任務(wù)的分配非常依賴中間控制器程序,當(dāng)中間控制器程序出現(xiàn)異常崩潰時(shí),會(huì)存在數(shù)據(jù)丟失或是浪費(fèi)機(jī)器資源的問題。

針對(duì)相關(guān)技術(shù)中通過中間控制器分配網(wǎng)絡(luò)爬蟲任務(wù)導(dǎo)致爬蟲系統(tǒng)變得較為復(fù)雜的問題,目前尚未提出有效的解決方案。

發(fā)明內(nèi)容

本申請(qǐng)的主要目的在于提供一種控制網(wǎng)絡(luò)爬蟲的任務(wù)分配方法和裝置,以解決相關(guān)技術(shù)中通過中間控制器分配網(wǎng)絡(luò)爬蟲任務(wù)導(dǎo)致爬蟲系統(tǒng)變得較為復(fù)雜的問題。

為了實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)的一個(gè)方面,提供了一種控制網(wǎng)絡(luò)爬蟲的任務(wù)分配方法。網(wǎng)絡(luò)爬蟲采用多線程執(zhí)行任務(wù),多線程預(yù)先存放于線程池內(nèi),該方法包括:通過信號(hào)量判斷多線程中的任務(wù)線程的數(shù)量是否達(dá)到任務(wù)最大并行數(shù),其中,信號(hào)量的初始值為任務(wù)最大并行數(shù),任務(wù)線程為經(jīng)過信號(hào)量的線程;在通過信號(hào)量判斷出多線程中的任務(wù)線程的數(shù)量達(dá)到任務(wù)最大并行數(shù)時(shí),阻止線程池內(nèi)的線程從URL隊(duì)列中獲取任務(wù);以及在通過信號(hào)量判斷出多線程中的任務(wù)線程的數(shù)量未達(dá)到任務(wù)最大并行數(shù)時(shí),控制線程池內(nèi)的線程從URL隊(duì)列中獲取任務(wù)。

進(jìn)一步地,通過信號(hào)量判斷多線程中的任務(wù)線程的數(shù)量是否達(dá)到任務(wù)最大并行數(shù)包括:判斷信號(hào)量的值是否為0;在判斷出信號(hào)量的值為0時(shí),則確定多線程中的任務(wù)線程的數(shù)量達(dá)到任務(wù)最大并行數(shù);以及在判斷出信號(hào)量的值不為0時(shí),則確定多線程中的任務(wù)線程的數(shù)量未達(dá)到任務(wù)最大并行數(shù)。

進(jìn)一步地,在通過信號(hào)量判斷出多線程中的任務(wù)線程的數(shù)量未達(dá)到任務(wù)最大并行數(shù)時(shí),控制線程池內(nèi)的線程從URL隊(duì)列中獲取任務(wù)之后,該方法還包括:將信號(hào)量的值減1,在任務(wù)線程的任務(wù)執(zhí)行完成或取消時(shí),方法還包括:將信號(hào)量的值加1。

進(jìn)一步地,在通過信號(hào)量判斷出多線程中的任務(wù)線程的數(shù)量達(dá)到任務(wù)最大并行數(shù)時(shí),阻止線程池內(nèi)的線程從URL隊(duì)列中獲取任務(wù)之后,該方法還包括:控制線程池內(nèi)的線程進(jìn)入等待狀態(tài)。

進(jìn)一步地,在通過信號(hào)量判斷多線程中的任務(wù)線程的數(shù)量是否達(dá)到任務(wù)最大并行數(shù)之前,該方法還包括:在網(wǎng)絡(luò)爬蟲啟動(dòng)時(shí),從數(shù)據(jù)庫中讀取任務(wù)最大并行數(shù),其中,數(shù)據(jù)庫中預(yù)先存儲(chǔ)有任務(wù)最大并行數(shù);以及將任務(wù)最大并行數(shù)賦值給信號(hào)量,并作為信號(hào)量的初始值。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610243866.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 玖玖国产精品视频| 国产97久久| bbbbb女女女女女bbbbb国产| 精品亚洲午夜久久久久91| 狠狠色噜噜狠狠狠狠69| 免费久久一级欧美特大黄| 99riav3国产精品视频| 99精品视频一区二区| 国产一区二区麻豆| 偷拍久久精品视频| 日韩av在线资源| 日本精品一区视频| 免费毛片a| 国产福利精品一区| 欧美国产三区| 国产精品乱码一区二区三区四川人 | 国产精品乱码一区| 欧美一区二区三区久久久精品| 日韩亚洲精品在线| 91日韩一区二区三区| 奇米色欧美一区二区三区| 2023国产精品自产拍在线观看| 国产91高清| 少妇厨房与子伦免费观看| 亚洲第一天堂久久| 欧洲国产一区| 色婷婷噜噜久久国产精品12p| 满春阁精品av在线导航| 国产乱一区二区三区视频| 欧美日韩国产精品一区二区三区| 欧美日韩国产精品一区二区| 国产日韩精品久久| av午夜在线| 国产精品剧情一区二区三区| 日本一二三区视频在线| 国产真裸无庶纶乱视频| 国产日韩欧美色图| 国产精品一品二区三区四区五区| 免费精品一区二区三区视频日产| 国产一区二区三区网站| 精品国产一区二区三区久久久久久| 日韩午夜三级| 狠狠躁夜夜| 国产高清在线精品一区二区三区| 久久九九国产精品| 一区二区三区欧美视频| 91中文字幕一区| 亚洲精品国产一区二区三区| 一区二区欧美精品| 99精品久久久久久久婷婷| 自偷自拍亚洲| 亚洲激情中文字幕| 男女午夜影院| 精品国产一区二区三区四区vr| 国产午夜亚洲精品午夜鲁丝片| 在线国产一区二区| 亚洲精品久久久中文| 国产色99| www亚洲精品| 欧美精品一区久久| 91精品国产综合久久福利软件| av午夜在线| 国产精品日韩电影| 久久99精品国产麻豆婷婷洗澡| 久久网站精品| 国产精品电影一区二区三区| 国产一区二区大片| 欧美精品日韩| 欧美亚洲精品suv一区| 性色av香蕉一区二区| 日韩av在线影视| 国产1区2区3区| 国产日韩精品一区二区三区| 久久福利视频网| 色噜噜狠狠色综合中文字幕| 午夜亚洲影院| 日本午夜精品一区二区三区| 日韩欧美国产高清91| 久久国产精品网站| 久久国产欧美一区二区三区免费| 九九热国产精品视频| 亚洲国产欧美一区| 日韩欧美中文字幕精品| 欧美性二区| 国产日韩一二三区| 国产97久久| 欧美日韩一区二区三区不卡视频| 乱子伦农村| 国产精品99999999| 狠狠色依依成人婷婷九月| 午夜av男人的天堂| 国产精品乱码久久久久久久| 午夜看片网址| 亚洲欧美色一区二区三区| 精品国产免费一区二区三区| 国产日韩欧美不卡| 久久99国产精品视频| 91高跟紫色丝袜呻吟在线观看| 亚洲精品456在线播放 | 久久久久国产精品免费免费搜索| 国产精品精品国内自产拍下载| 亚洲欧美日韩另类精品一区二区三区| 午夜精品在线观看| 国产精品一区二区中文字幕| 超碰97国产精品人人cao| 日本精品一区二区三区在线观看视频| 国产精品视频一二区| 精品国产乱码久久久久久软件影片| 欧美激情图片一区二区| 欧美乱大交xxxxx古装| 日韩av在线资源| 久久天天躁狠狠躁亚洲综合公司| 久久人91精品久久久久久不卡| 日韩a一级欧美一级在线播放| 狠狠色依依成人婷婷九月| 综合久久激情| 国产伦精品一区二区三区电影| 久久久久久久久亚洲精品一牛| 久久一区欧美| 色综合久久久久久久粉嫩| 欧美日本一二三区| 日韩免费一级视频| 91精品久久久久久综合五月天 | 欧美日韩三区二区| 国产一区二区电影在线观看| 国产一区二区片| 狠狠色综合久久丁香婷婷| 日韩毛片一区| 欧美在线一区二区视频| 日本精品在线一区| 欧美视屏一区| 狠狠色狠狠色合久久伊人| 欧美一区二区三区免费视频| 国产一区二区极品| 国产一二区视频| 中文字幕av一区二区三区高| 国产乱老一区视频| 亚洲高清久久久| 亚洲国产美女精品久久久久∴| 夜夜爱av| 日韩精品中文字幕久久臀| 91精品色| 欧美日韩亚洲三区| 欧美一级久久精品| 91香蕉一区二区三区在线观看| 久久不卡精品| 日本午夜久久| 日本美女视频一区二区三区| 久免费看少妇高潮a级特黄按摩| 亚洲精品日韩在线| 中文字幕亚洲欧美日韩在线不卡| 2023国产精品久久久精品双| 国产一区二区视频免费在线观看 | 日韩区欧美久久久无人区| 欧美在线视频一二三区| 欧美精品国产精品| 在线观看欧美一区二区三区| 国产91在| 午夜免费片| 精品一区二区三区自拍图片区| 91久久免费| 国产精品18久久久久白浆| 黄色香港三级三级三级| 午夜影院一级| 中文无码热在线视频| 天堂av一区二区| 欧美国产三区| 色吊丝av中文字幕| 国产精品久久久久久亚洲调教| 国产剧情在线观看一区二区| 素人av在线| 日韩欧美亚洲视频| 欧美日韩一区二区三区不卡| 国产精品99久久久久久宅男| 午夜无人区免费网站| 99精品视频免费看| 国产黄色网址大全| 国产精品一区在线观看你懂的 | 一本色道久久综合亚洲精品浪潮| 69久久夜色精品国产69乱青草| 午夜爽爽爽男女免费观看| 午夜无人区免费网站| 91亚洲精品国偷拍自产| 国产伦高清一区二区三区| 精品国产区| 国产女人和拘做受在线视频| 国产精品视频一区二区在线观看| 国产精品剧情一区二区三区| 素人av在线| 日韩精品一区二区亚洲| 国产精品久久久综合久尹人久久9| 热99re久久免费视精品频软件| 思思久久96热在精品国产| 欧美精品日韩| 亚洲精品国产一区| 国产视频一区二区视频| 国产乱码精品一区二区三区介绍| 91久久国产露脸精品| 精品国产一区二区三区高潮视 | 久久99亚洲精品久久99| **毛片在线免费观看| 午夜片在线| 大桥未久黑人强制中出| 午夜剧场a级片| 久久精品国产亚洲一区二区| 香蕉av一区二区| 日韩中文字幕亚洲欧美| 国产999在线观看| 国产盗摄91精品一区二区三区| 午夜特片网| 久久人人97超碰婷婷开心情五月| 亚洲精品少妇一区二区 | 国产精品综合一区二区三区| 精品国产区一区二| 国产视频一区二区在线播放| 亚洲乱码一区二区三区三上悠亚| 亚洲欧美自拍一区| 中文在线√天堂| 乱子伦农村| 午夜看片网| 99热久久精品免费精品| 91福利视频免费观看| 年轻bbwbbw高潮| 国产一区二区视频免费在线观看| 色乱码一区二区三在线看| 日韩中文字幕在线一区| 欧美一区二区三区免费看| 欧美精品综合视频| 免费精品99久久国产综合精品应用| 久久国产欧美一区二区免费| 91秒拍国产福利一区| 狠狠色很很在鲁视频| 夜色av网| 激情aⅴ欧美一区二区三区| 日本美女视频一区二区| 日韩一区免费| 香蕉av一区二区| 国产精品视频二区三区| 欧美激情综合在线| 日本一区二区电影在线观看| 视频一区二区中文字幕| 999国产精品999久久久久久| 日韩欧美国产高清91| 欧洲精品一区二区三区久久| 精品一区二区三区自拍图片区| 91久久精品国产91久久性色tv|