日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種數據抓取方法及裝置有效

專利信息
申請號: 201710985479.2 申請日: 2017-10-20
公開(公告)號: CN110020046B 公開(公告)日: 2021-06-15
發明(設計)人: 初光磊;丁彬;段盼盼;李學環;齊驥;錢嶺;胡靜;李京昊 申請(專利權)人: 中移(蘇州)軟件技術有限公司;中國移動通信集團公司
主分類號: G06F16/951 分類號: G06F16/951;G06F9/48
代理公司: 北京同達信恒知識產權代理有限公司 11291 代理人: 郭潤湘
地址: 215163 江*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 數據 抓取 方法 裝置
【說明書】:

發明公開了一種數據抓取方法及裝置,其中,所述方法包括:基于用戶訪問互聯網的行為,生成網絡爬蟲對目標網站服務器進行抓取數據的任務對應的調度時間;基于所述調度時間對所述任務進行管理;在將所述任務發送給所述網絡爬蟲后,通過所述網絡爬蟲在所述目標網站服務器中進行數據抓取。用于解決現有數據抓取效率低,公平性差的技術問題,提高了數據抓取效率,且保證了抓取任務調度的公平性。

技術領域

本發明涉及計算機應用領域與信息技術領域,特別涉及一種數據抓取方法及裝置。

背景技術

隨著互聯網知識數據的爆炸式增長以及大數據技術在互聯網和信息行業的飛速發展,人們越來越依賴于網絡爬蟲來進行互聯網數據的抓取。然而,傳統的網絡爬蟲為了盡可能多的獲取網站中的高價值信息,會根據特定策略進行大規模的頁面訪問,不僅給互聯網網站的服務器帶來額外的負載壓力,而且占用了大量的網絡帶寬,造成網絡擁塞,最終導致數據抓取效率的降低。

因此,很多網站為了應對這一問題,對用戶的訪問頻率進行了監測:當一段時間內來自于同一個源地址的請求數過多時,服務器將會限制該地址用戶的后續訪問。目前,面對因不合理的抓取方式而被限制訪問的問題,網絡爬蟲主要采取使用代理IP和設置數據抓取頻率兩種方案。也就是說,第一種方案具體為:網絡爬蟲系統先將請求發往代理IP,再由代理IP代為訪問目標網站。第二種方案具體為:網絡爬蟲系統通過控制數據抓取頻率來實現禮貌抓取。

其中,第一種方案盡管可以避免服務器的對固定IP訪問的限制,但是目標網站服務器的負載壓力過大的問題并沒有得到有效的解決,沒有真正地實現禮貌抓取。此外,使用代理IP一方面引入了代理轉發的過程,增大了網絡負載;另一方面需要額外的時間與資源來判斷代理IP的可用性,降低了網絡爬蟲任務執行成功率。因此,使用代理IP的方法無法應用于面向全網的大規模數據抓取系統。

第二種方案盡管能夠實現真正意義上的禮貌爬取,但是這種方法是以犧牲網絡爬蟲的網絡IO性能為代價的。在百兆帶寬普及的今天,網絡帶寬已不是網絡爬蟲的性能瓶頸,而為網絡爬蟲設置任務執行的頻率不能充分地利用現有的帶寬資源,無法達到預期的抓取效率。

此外,在現有技術中,除了使用上述提到的兩種方案外,還采用將抓取任務隨機打亂之后插入到待抓取隊列中等待抓取。盡管這種做法在避免對同一服務器進程長時間的連續訪問的同時保證了網絡爬蟲的高效。然而,這種做法雖然在一定程度上實現了“禮貌爬取”,但是由于缺少對抓取任務的控制,會引發抓取任務調度中的公平性問題,比如,某些任務很早就加入到待抓取隊列,但是卻一直未得到調度。

可見,在現有技術中,存在對數據抓取效率低,公平性差的技術問題。

發明內容

本發明實施例提供一種數據抓取方法及裝置,用于解決現有數據抓取效率低,公平性差的技術問題,提高了數據抓取效率,且保證了抓取任務調度的公平性。

一方面,本發明實施例提供了一種數據抓取方法,包括:

基于用戶訪問互聯網的行為,生成網絡爬蟲對目標網站服務器進行抓取數據的任務對應的調度時間;

基于所述調度時間對所述任務進行管理;

在將所述任務發送給所述網絡爬蟲后,通過所述網絡爬蟲在所述目標網站服務器中進行數據抓取。

可選地,所述基于用戶訪問互聯網的行為,生成網絡爬蟲對目標網站服務器進行抓取數據的任務對應的調度時間,包括:

基于用戶訪問互聯網的行為,建立網絡爬蟲對目標網站服務器進行抓取數據的任務的泊松過程模型;

基于所述泊松過程模型,生成所述任務對應的調度時間。

可選地,所述基于所述調度時間對所述任務進行管理,包括:

建立包括待抓取隊列、結果隊列和等待隊列的至少三個工作隊列;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中移(蘇州)軟件技術有限公司;中國移動通信集團公司,未經中移(蘇州)軟件技術有限公司;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710985479.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩美一区二区三区| 国产一区二区在| 亚洲日本国产精品| 国产欧美一区二区三区视频| 午夜色影院| 欧美日本三级少妇三级久久| 国产精品国产三级国产播12软件| 亚洲一区中文字幕| 日韩精品福利片午夜免费观看| www亚洲精品| 夜色av网| 久久99国产精品久久99| 在线观看欧美一区二区三区 | 国产精品日韩视频| 国产91高清| 国产一区二区视频免费在线观看 | 免费a级毛片18以上观看精品| 国产在线视频99| 精品少妇一区二区三区免费观看焕 | 日韩有码一区二区三区| 中文字幕av一区二区三区四区| 狠狠色狠狠色综合日日五| 欧美精品九九| 国产在线一区观看| 狠狠色很很在鲁视频| 免费看欧美中韩毛片影院| 午夜亚洲影院| 精品国产乱码久久久久久久久| 中文字幕一区二区三区日韩精品| 2020国产精品自拍| 国产videosfree性另类| 国产日韩欧美在线影视| 精品videossexfreeohdbbw| 九一国产精品| 欧美日本一二三区| 国产aⅴ精品久久久久久| 性国产日韩欧美一区二区在线| 日日夜夜一区二区| 四虎国产精品永久在线| 国产精品欧美久久| 欧美日韩国产一区二区三区在线观看| 最新国产精品久久精品| 国产一区二区播放| 处破大全欧美破苞二十三| 国产资源一区二区| 999久久久国产精品| 欧美亚洲精品一区二区三区| 美国三级日本三级久久99| 欧美精品中文字幕亚洲专区| 亚洲高清国产精品| 欧美一级久久精品| 免费欧美一级视频| 久久精品麻豆| 高清国产一区二区三区| 亚洲四区在线| 亚洲精品乱码久久久久久写真| 国产欧美三区| 91看片app| 国产一区二区三区的电影| 狠狠色噜噜狠狠狠狠88| 神马久久av| 国产欧美一区二区三区在线播放| 性色av香蕉一区二区| 久久99精品国产麻豆宅宅| 亚洲乱小说| bbbbb女女女女女bbbbb国产| 激情久久综合| 午夜理伦影院| 在线精品一区二区| 中文字幕视频一区二区| 91午夜在线| 欧美极品少妇| 日本久久不卡| 国产亚洲综合一区二区| 国产精品理人伦一区二区三区| 日韩精品乱码久久久久久| 国产精品欧美一区二区三区| 99国产精品99久久久久久粉嫩| 国产精品v亚洲精品v日韩精品| 亚洲日韩欧美综合| 精品无人国产偷自产在线| 日韩一区免费| 国产91精品一区二区麻豆亚洲| 欧美精品在线观看一区二区| 国产精品入口麻豆九色| 狠狠色噜噜狠狠狠狠色综合久老司机| 欧美一区二区三区免费视频| 中文字幕久久精品一区| 一区二区三区欧美在线| 韩日av一区二区三区| 99热一区二区| 久久一级精品| 亚洲视频h| 色综合久久精品| 亚洲国产欧洲综合997久久,| 久久人人97超碰婷婷开心情五月| 欧美激情视频一区二区三区免费| 男女无遮挡xx00动态图120秒| 国产在线观看免费麻豆| 国产精品乱综合在线| 午夜剧场一级片| 国产69精品久久久久999小说| 国产精品香蕉在线的人| 精品国产一级| 91av一区二区三区| 久久久久久亚洲精品| 日韩精品一区二区中文字幕| 99精品小视频| 99精品欧美一区二区| 欧美精品中文字幕在线观看| 免费看片一区二区三区| 国产婷婷色一区二区三区在线| 亚洲欧美一区二| 麻豆精品久久久| 日韩精品一区二区三区在线| 久久福利免费视频| 亚洲国产精品女主播| 国产一区二区三级| 国产91精品一区二区麻豆亚洲| 99精品视频一区| 丰满岳乱妇在线观看中字 | 国产精品日产欧美久久久久| 91国内精品白嫩初高生| 日韩av在线播| 中文av一区| 国产精品96久久久久久又黄又硬| 午夜亚洲国产理论片一二三四 | 欧美一区二区三区久久| 欧美精品国产一区二区| 国产精品久久久久久久久久久久久久久久| 国产一区二区a| 国产麻豆一区二区三区精品| 一区二区三区欧美视频| 右手影院av| 国产视频一区二区视频| 欧美精选一区二区三区| 爱看av在线入口| 国产精品一区亚洲二区日本三区| 玖玖精品国产| 亚洲三区在线| 亚洲精品一区中文字幕| 久草精品一区| 亚洲国产日韩综合久久精品| 欧美精品第一区| 久久一区二| 99久久久国产精品免费无卡顿| 欧美乱大交xxxxx胶衣| 国产午夜三级一二三区| 99热一区二区| 国产精品视频久久| 午夜码电影| 日本美女视频一区二区三区| 91偷拍网站| 欧美在线一级va免费观看| 精品亚洲午夜久久久久91| 国产亚洲精品久久777777| 美女脱免费看直播| 亚洲欧美国产中文字幕 | 狠狠色噜噜狠狠狠狠色综合久老司机| 国产一区亚洲一区| 国产精品一区二区免费视频| 亚洲精品乱码久久久久久蜜糖图片| 国产精品综合在线| 97人人模人人爽视频一区二区 | 国产欧美综合一区| 欧美精品综合视频| 毛片大全免费观看| 久久99精品国产| 日韩久久精品一区二区| 中文字幕一区三区| 欧美日韩国产91| 97精品国产97久久久久久免费| 中文字幕1区2区3区| 欧美一区久久久| 日韩精品一区二区中文字幕| 国产日韩麻豆| 午夜片在线| 国产欧美性| 国产精品国外精品| 国产欧美精品va在线观看| 91精品视频在线免费观看| 国产精品视频免费一区二区| 天摸夜夜添久久精品亚洲人成| 97一区二区国产好的精华液| 99精品视频一区| 国产91丝袜在线| 日韩欧美国产高清91| 国产一区二区三级| 久久国产这里只有精品| 国内少妇自拍视频一区| 久久精品欧美一区二区| 中文字幕制服丝袜一区二区三区 | 久99久视频| 午夜看大片| 国产区精品区| 欧美一区视频观看| 91久久精品在线| 欧美三级午夜理伦三级中视频| 国产一区影院| 日本一区二区三区免费播放| 99国产伦精品一区二区三区| 色一情一乱一乱一区99av白浆| 午夜影院伦理片| 91久久一区二区| 欧美一区二区三区白人| 日韩中文字幕久久久97都市激情| 国产日韩欧美网站| 国产一区欧美一区| 国产一区二区视频免费在线观看| 久久久久久久久久国产精品| 性欧美精品动漫| 在线国产一区二区| 日韩一级精品视频在线观看 | 狠狠色噜狠狠狠狠| 午夜无遮挡| 欧美高清视频一区二区三区| 精品久久久久久中文字幕| 亚洲精品少妇一区二区| 亚洲一二三四区| 亚洲精品久久久久中文字幕欢迎你 | 视频一区二区国产| 午夜毛片影院| 国产精品久久久不卡| 国产99视频精品免费视频7| 91精品啪在线观看国产| 欧美一区二区三区精品免费| 亚洲精品中文字幕乱码三区91| 视频一区二区中文字幕| 久久精品综合视频| 羞羞视频网站免费| 欧美日韩国产色综合一二三四| 久久精品视频3| 99视频一区| 国产欧美日韩一级| 少妇特黄v一区二区三区图片| 国产99视频精品免费视频7 | 国产一级片一区| 亚洲午夜天堂吃瓜在线| 狠狠色成色综合网| 国产床戏无遮挡免费观看网站| 午夜大片网| 欧美一区二区激情三区| 国产在线拍揄自揄拍| 国产一区二区三区网站| 狠狠躁夜夜躁2020| 亚洲乱码一区二区|