日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種數據抓取方法及裝置有效

專利信息
申請號: 201710985479.2 申請日: 2017-10-20
公開(公告)號: CN110020046B 公開(公告)日: 2021-06-15
發明(設計)人: 初光磊;丁彬;段盼盼;李學環;齊驥;錢嶺;胡靜;李京昊 申請(專利權)人: 中移(蘇州)軟件技術有限公司;中國移動通信集團公司
主分類號: G06F16/951 分類號: G06F16/951;G06F9/48
代理公司: 北京同達信恒知識產權代理有限公司 11291 代理人: 郭潤湘
地址: 215163 江*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 數據 抓取 方法 裝置
【權利要求書】:

1.一種數據抓取方法,其特征在于,包括:

基于用戶訪問互聯網的行為,生成網絡爬蟲對目標網站服務器進行抓取數據的任務對應的調度時間;

基于所述調度時間對所述任務進行管理;

在將所述任務發送給所述網絡爬蟲后,通過所述網絡爬蟲在所述目標網站服務器中進行數據抓取;

其中,所述基于用戶訪問互聯網的行為,生成網絡爬蟲對目標網站服務器進行抓取數據的任務對應的調度時間,包括:

基于用戶訪問互聯網的行為,建立網絡爬蟲對目標網站服務器進行抓取數據的任務的泊松過程模型;

基于所述泊松過程模型,生成所述任務對應的調度時間;

其中,所述基于所述泊松過程模型,生成所述任務對應的調度時間,包括:

通過所述泊松過程模型,生成所述網絡爬蟲對所述目標網站服務器進行訪問的兩條任務間的服從指數分布的時間間隔;

在初始化時間點之后,生成所述網絡爬蟲對所述目標網站服務器進行抓取數據的任務的調度時間。

2.如權利要求1所述的方法,其特征在于,所述基于所述調度時間對所述任務進行管理,包括:

建立包括待抓取隊列、結果隊列和等待隊列的至少三個工作隊列;

當系統的當前時間到達所述任務對應的調度時間時,從所述待抓取隊列中提取所述網絡爬蟲需在當前時刻進行抓取的第一鏈接地址集;

在所述網絡爬蟲抓取所述第一鏈接地址集之后,將抓取過程中提取到的子鏈接地址集插入所述結果隊列,且將所述網絡爬蟲尚未抓取且等待調度的第二鏈接地址集插入所述等待隊列,其中,所述結果隊列還包括與所述子鏈接地址集對應的服務器地址集,每個子鏈接地址對應一個服務器地址,所述等待隊列還包括與所述第二鏈接地址集對應的調度時間集,每個第二鏈接地址對應一個調度時間。

3.如權利要求2所述的方法,其特征在于,所述基于所述調度時間對所述任務進行管理,包括:

獲取所述待抓取隊列的隊列長度;

若所述隊列長度小于一預設調度閾值,將所述等待隊列的每個鏈接地址根據優先級由小到大插入所述待抓取隊列,獲得更新后的待抓取隊列。

4.如權利要求2所述的方法,其特征在于,所述基于所述調度時間對所述任務進行管理,包括:

在接收到所述等待隊列的更新請求時,將所述結果隊列的每個子鏈接地址基于對應的服務器地址按照第一預設規則插入所述等待隊列,并將確定的每個子鏈接地址對應的調度時間相應的插入所述等待隊列,獲得更新后的等待隊列。

5.如權利要求2所述的方法,其特征在于,所述基于所述調度時間對所述任務進行管理,包括:

當所述系統的當前時間到達所述待抓取隊列的隊頭對應的任務的調度時間時,調度隊頭對應的任務,將隊頭對應的任務發送給所述網絡爬蟲,通過所述網絡爬蟲在所述目標網站服務器中抓取獲得第三鏈接地址集;

將所述第三鏈接地址集中每個鏈接地址基于對應的服務器地址按照第二預設規則插入所述結果隊列,獲得更新后的結果隊列。

6.一種數據抓取裝置,其特征在于,包括:

生成模塊,基于用戶訪問互聯網的行為,生成網絡爬蟲對目標網站服務器進行抓取數據的任務對應的調度時間;

處理模塊,基于所述調度時間對所述任務進行管理;且在將所述任務發送給所述網絡爬蟲后,通過所述網絡爬蟲在所述目標網站服務器中進行數據抓取;

其中,所述生成模塊用于:

基于用戶訪問互聯網的行為,建立網絡爬蟲對目標網站服務器進行抓取數據的任務的泊松過程模型;

基于所述泊松過程模型,生成所述任務對應的調度時間;

其中,所述生成模塊用于:

通過所述泊松過程模型,生成所述網絡爬蟲對所述目標網站服務器進行訪問的兩條任務間的服從指數分布的時間間隔;

在初始化時間點之后,生成所述網絡爬蟲對所述目標網站服務器進行抓取數據的任務的調度時間。

7.一種計算機裝置,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至5任一權項所述方法的步驟。

8.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至5任一權項所述方法的步驟。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中移(蘇州)軟件技術有限公司;中國移動通信集團公司,未經中移(蘇州)軟件技術有限公司;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710985479.2/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91理论片午午伦夜理片久久 | 国产高清一区二区在线观看| 日本一二三区视频在线| 91丝袜国产在线播放| 国产精品高潮呻吟久| 久久第一区| 少妇高潮一区二区三区99小说| 国产乱码一区二区| 日本美女视频一区二区| 中文字幕亚洲欧美日韩在线不卡| 中文字幕+乱码+中文字幕一区| 97久久国产亚洲精品超碰热| 亚洲精华国产欧美| 少妇中文字幕乱码亚洲影视 | 中文字幕欧美日韩一区| 午夜黄色网址| 久久96国产精品久久99软件| 精品综合久久久久| 99热久久这里只精品国产www | www色视频岛国| 美日韩一区| 国产亚洲精品久久777777| 色吊丝av中文字幕| 国产免费区| 一区二区三区国产欧美| 国产伦精品一区二区三区免| 欧美日韩精品中文字幕| 国语对白一区二区| 亚洲自拍偷拍中文字幕| 久久久精品中文| 亚洲精品乱码久久久久久按摩| 亚洲精品一区,精品二区| 国产精品视频一区二区三| 欧美一区二区三区久久久精品| 国产精品欧美日韩在线| 精品国产一级| 中文字幕欧美一区二区三区| 99色精品视频| 国产精品免费自拍| 一区不卡av| 久久精品爱爱视频| 日本一区欧美| 一区二区三区四区视频在线| 香港三日三级少妇三级99| 欧美大片一区二区三区| 国产色午夜婷婷一区二区三区| 欧美大成色www永久网站婷| 欧美激情国产一区| 久久精视频| 亚洲精品国产精品国产| 国产二区三区视频| 免费xxxx18美国| 天天射欧美| 91精品久久久久久综合五月天| 国产精品免费专区| 91高清一区| 影音先锋久久久| 国内自拍偷拍一区| 久久久久国产亚洲日本| 99久久婷婷国产综合精品电影| 日本久久不卡| 日日夜夜一区二区| 销魂美女一区二区| 99国产精品丝袜久久久久久| 国产91丝袜在线播放动漫| 欧美日韩一级黄| 一级久久精品| 亚洲国产精品美女| 日韩精品少妇一区二区在线看| 欧美精品五区| 99久久婷婷国产亚洲终合精品| 99国产伦精品一区二区三区| 日本神影院一区二区三区| 97人人揉人人捏人人添| 99色精品视频| 国产一区二区播放| 国产日韩欧美在线一区| 日韩精品午夜视频| 91久久精品久久国产性色也91| 一区精品二区国产| 国产亚洲精品精品国产亚洲综合| 国产女性无套免费看网站| 精品国产一区二区三区四区四| 男女视频一区二区三区| 午夜精品一区二区三区三上悠亚 | 国产精品电影一区二区三区| 精品99在线视频| 午夜叫声理论片人人影院| 美日韩一区| 精品久久久久久亚洲综合网| 国产精品亚洲二区| 亚洲欧美国产日韩色伦| 国产午夜精品av一区二区麻豆| 一区二区三区国产精品| 狠狠色噜噜狠狠狠狠777| 国产一区亚洲一区| 蜜臀久久精品久久久用户群体| 日韩精品999| 国产黄一区二区毛片免下载| 国产精品videossex国产高清| 午夜肉伦伦影院九七影网| 91日韩一区二区三区| 国内久久久| 一区二区三区国产精品| 日本白嫩的18sex少妇hd| 91夜夜夜| 人人要人人澡人人爽人人dvd| 国产不卡一二三区| 激情欧美一区二区三区| **毛片在线免费观看| 国产精品99在线播放| 国产精品一区二区人人爽| 亚洲欧美日韩在线| 亚洲精品一区在线| 国产91九色视频| 国产九九九精品视频| 国产精品国产三级国产专区51区| 国产女人与拘做受免费视频| 国产精品天堂网| 日本一二三不卡| 国产一级片子| 精品福利一区| 国产精品对白刺激久久久| 91一区二区三区视频| 狠狠色狠狠综合久久| 欧美精品久| 狠狠色噜噜狠狠狠狠米奇7777| 亚洲精品一区,精品二区| 草逼视频网站| 91久久香蕉| 一区二区三区国产精华| 91麻豆精品国产91久久| 色就是色欧美亚洲| 国产精品九九九九九九九| 91精品视频一区二区| 国产不卡一二三区| 香蕉免费一区二区三区在线观看| 国产99久久九九精品| 欧洲精品一区二区三区久久| 夜夜躁日日躁狠狠久久av| 色婷婷综合久久久中文一区二区| 日韩一级在线视频| 国产色婷婷精品综合在线手机播放| 精品999久久久| 国产91久| 国产精品国产亚洲精品看不卡15 | 国产在线播放一区二区| 精品国产乱码久久久久久老虎| 欧美激情片一区二区| 国产精品乱战久久久| 久久精品99国产国产| 久久精品国产一区二区三区| 4399午夜理伦免费播放大全| 国产乱人伦偷精品视频免下载| 国产精品视频久久久久久久| 综合久久国产九一剧情麻豆| 亚洲精品国产主播一区| 亚洲区在线| 91精品综合在线观看| 一区二区在线精品| 久久精品色欧美aⅴ一区二区| 国产精品无码专区在线观看| 狠狠躁夜夜av| 欧美一区二区三区在线免费观看 | 狠狠色噜噜狠狠狠狠色综合久老司机| 日韩无遮挡免费视频| xxxxhdvideosex| 97视频精品一二区ai换脸| 欧美高清性xxxx| 91视频国产一区| 亚洲国产欧美一区| 亚洲国产偷| 国产午夜精品免费一区二区三区视频| 国产精品久久久麻豆| 中文字幕在线播放一区| 九一国产精品| 一本大道久久a久久精品| 国产理论一区| 香港三日三级少妇三级99| 久久午夜鲁丝片午夜精品| 神马久久av| 扒丝袜网www午夜一区二区三区| 素人av在线| 福利片91| 日本精品一区视频| 国产91电影在线观看| 991本久久精品久久久久| 日韩一区国产| 欧美午夜精品一区二区三区| 国产99久久九九精品| 97精品国产aⅴ7777| 亚洲精品久久久久中文字幕欢迎你| 国产精品视频一区二区三| 欧美在线观看视频一区二区 | 一区二区三区国产精华| 精品久久国产视频| 狠狠躁夜夜| 91精品国模一区二区三区| 久久国产激情视频| 午夜剧场a级免费| 国产香蕉97碰碰久久人人| 国产日韩欧美精品一区| 色噜噜狠狠一区二区| 国产欧美日韩va另类在线播放| 欧美精品粉嫩高潮一区二区| 国产欧美日韩一级大片| 国产99久久久精品视频| 国产精品电影免费观看| 福利视频亚洲一区| 午夜av免费观看| 中文丰满岳乱妇在线观看| 色妞www精品视频| 国产亚洲精品久久久久久久久动漫| 国产精品高清一区| 国产精品一二三区免费| 国产一级二级在线| 日本一区二区免费电影| 中文字幕a一二三在线| 国产91一区| 久久久久久久久久国产精品| 免费看片一区二区三区| 国语精品一区| 国产伦精品一区二区三区免| 日本久久不卡| 欧美大片一区二区三区| 精品91av| 国产主播啪啪| 99精品久久99久久久久| 日韩精品福利片午夜免费观看| 丝袜脚交一区二区| 国产乱了高清露脸对白| 欧美一区二区三区另类| 日韩a一级欧美一级在线播放| 国产亚洲精品久久久久秋霞 | 午夜特片网| 国产无遮挡又黄又爽免费网站| 国产欧美一区二区三区沐欲| 午夜生活理论片| 国产一级在线免费观看| 91久久国产视频| 国产精品欧美一区乱破| 日韩精品一区在线视频| 大bbw大bbw超大bbw| 91丝袜诱惑| 亚洲乱码一区二区三区三上悠亚 | 欧美精品免费一区二区|