日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種網絡爬蟲系統及網絡爬蟲多任務執行和調度方法有效

專利信息
申請號: 201310610659.4 申請日: 2013-11-26
公開(公告)號: CN103605764B 公開(公告)日: 2017-10-24
發明(設計)人: 宋軻;劉世才;毛海濤 申請(專利權)人: TCL集團股份有限公司
主分類號: G06F17/30 分類號: G06F17/30;G06F9/46
代理公司: 深圳市君勝知識產權代理事務所(普通合伙)44268 代理人: 王永文,劉文求
地址: 516001 廣東省惠州市*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 網絡 爬蟲 系統 任務 執行 調度 方法
【說明書】:

技術領域

發明涉及搜索引擎技術領域,尤其涉及一種網絡爬蟲系統及網絡爬蟲多任務執行和調度方法。

背景技術

隨著互聯網信息的爆炸式增長,傳統的網絡爬蟲采集數據的方式已經逐漸顯示出劣勢。傳統的網絡爬蟲采集數據時任務沒有細粒度的切分,耗時比較長,服務器CPU、內存和網絡帶寬的限制,數據爬取效率比較低下,而且容易出現單點故障。

因此,現有技術還有待于改進和發展。

發明內容

鑒于上述現有技術的不足,本發明的目的在于提供一種網絡爬蟲系統及網絡爬蟲多任務執行和調度方法,旨在解決目前網絡爬蟲采集數據方法效率低,耗時長的問題。

本發明的技術方案如下:

一種網絡爬蟲多任務執行和調度方法,其中,所述方法包括:

A、根據不同的內容和網站特點,對待爬取內容進行細粒度切分并根據切分后內容分別制作各爬蟲解析模板文件,設置網絡爬蟲分別結合各爬蟲解析模板文件形成用于執行爬取任務的各采集模塊;

B、多個節點服務器上分別部署所述網絡爬蟲,每個節點服務器分別設置有用于調度爬取任務的調度器;

C、所述調度器按照預先定義的調度策略調用關聯的采集模塊執行爬取任務進行數據采集。

所述的網絡爬蟲多任務執行和調度方法,其中,所述步驟A中根據不同的內容和網站特點,對待爬取內容進行細粒度切分具體為:

當所述待爬取內容包括多個類型相同的網站時,將多個類型相同的網站切分為單個網站;

或者,當單個網站包含多個內容不同的版塊時,將單個網站切分為不同的版塊;

或者,當單一板塊中包含多個頁面時,將單一板塊切分為多個頁面。

所述的網絡爬蟲多任務執行和調度方法,其中,所述切分后的內容之間無關聯性,所述各采集模塊分別對應關聯各爬取任務。

所述的網絡爬蟲多任務執行和調度方法,其中,所述各爬取任務之間無關聯性,每一爬取任務通過一獨立線程完成。

所述的網絡爬蟲多任務執行和調度方法,其中,所述預先定義的調度策略包括:

指定所述爬取任務在一固定的節點服務器上執行;

按照所述節點服務器節點等比原則在多個節點服務器中隨機分配爬取任務;

根據所述多個節點服務器當前的資源信息,優先選擇資源利用率低的節點服務器執行爬取任務。

所述的網絡爬蟲多任務執行和調度方法,其中,所述預先定義的調度策略具體設置為:

預先設置并存儲一信息列表,所述信息列表中存儲有所述節點服務器的IP、端口信息、爬取任務信息;讀取所述信息列表獲取爬取任務與節點服務器的對應關系,按照所述對應關系在相應的節點服務器上的執行爬取任務;

設置所述各節點服務器節點權重均為1,按照該等比原則在多個節點服務器中隨機分配爬取任務;

定期獲取所述多個節點服務器當前的CPU、內存資源信息,根據所獲取的資源信息優先選擇資源利用率低的節點服務器執行爬取任務,若存在資源利用率相同的節點服務器,則在該類節點服務器中隨機分配爬取任務。

所述的網絡爬蟲多任務執行和調度方法,其中,所述方法還包括:設置一用于保存爬取任務信息的數據庫,所述數據庫分別與所述多個節點服務器相連接,所述節點服務器上的各調度器通過各自獨立的線程定期檢查所述數據庫。

所述的網絡爬蟲多任務執行和調度方法,其中,所述步驟C中所述調度器按照預先定義的調度策略調用關聯的采集模塊之前還包括:

所述節點服務器第一次運行時,將所獲取的爬取任務信息初始化到所述數據庫。

所述的網絡爬蟲多任務執行和調度方法,其中,所述步驟C具體為:到爬取任務觸發時間時,按照預先定義的調度策略,所述服務器節點的調度器觸發自己的觸發器獲取數據庫鎖,獲取所述數據庫鎖的調度器調用關聯的采集模塊,網絡爬蟲加載所述爬蟲解析模板文件采集數據,同時更新爬取任務狀態并持久化到所述數據庫。

一種具有如上所述的網絡爬蟲多任務執行和調度的系統,其中,所述系統包括:

數據庫:分別所述節點服務器連接用于保存爬取任務信息;

節點服務器,用于執行網絡爬蟲爬取任務;所述節點服務器包括:

采集模塊,通過所述爬蟲解析模板文件形成用于具體執行爬取任務并進行數據采集;

調度器,用于按照預先定義的調度策略調用關聯的采集模塊執行爬取任務。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于TCL集團股份有限公司,未經TCL集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310610659.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美午夜精品一区二区三区| 国产一区二区精品免费| 亚洲天堂国产精品| 淫片免费看| 国产精品综合一区二区| 欧美日韩一区二区三区在线观看视频| 99精品国产免费久久| 国产精品久久免费视频在线| 国产精品剧情一区二区三区| 免费看欧美中韩毛片影院| 91视频国产一区| 欧洲精品一区二区三区久久| 色综合久久久久久久粉嫩| 国产足控福利视频一区| 亚洲欧美日韩国产综合精品二区| 亚洲国产精品97久久无色| 97人人模人人爽视频一区二区| 91国内精品白嫩初高生| 国产精品九九九九九| 久久国产中文字幕| 91国产在线看| 日韩亚洲欧美一区| 91国产一区二区| 国产一区二区视频播放| 超碰97国产精品人人cao| 高清欧美精品xxxxx在线看| 日本精品99| 欧美一区二区在线不卡| 96国产精品视频| 欧美国产亚洲精品| 91久久国产露脸精品| 亚洲国产一区二区精品| 国产精品一区二区日韩新区| 国产一区二区在线观看免费| 国产精品精品视频一区二区三区| 午夜影院激情| 久久国产激情视频| 97人人澡人人添人人爽超碰| 91精彩刺激对白露脸偷拍| 日本精品一区视频| 精品久久久久久久久亚洲| 国产高清一区在线观看| 久久综合二区| 欧美激情在线免费| 午夜剧场伦理| 国产一区二区三区精品在线| 亚洲欧美精品suv| 国产精品久久久久久久久久久久冷| 国内精品99| 国产精一区二区三区| 日本一二三四区视频| 国产精品综合久久| 亚洲精品乱码久久久久久高潮| 日韩欧美多p乱免费视频| 国产一区亚洲一区| 玖玖精品国产| 国产乱xxxxx97国语对白| 中文字幕日韩一区二区| 亚洲福利视频一区| 麻豆精品一区二区三区在线观看| 国产一区二区三区黄| 日韩精品久久久久久久的张开腿让| 国产精品麻豆99久久久久久| 亚洲欧美国产中文字幕| 精品久久二区| 91麻豆精品一区二区三区 | 日韩三区三区一区区欧69国产| 日韩av不卡一区| 日本中文字幕一区| 少妇厨房与子伦在线观看| 午夜黄色一级电影| 国产亚洲精品久久久久秋霞 | 久久综合狠狠狠色97| 国产精品不卡一区二区三区| 国产白嫩美女在线观看| 国产欧美一区二区三区四区| 鲁丝一区二区三区免费观看| 日本一二三区视频在线| 一级午夜影院| 欧美极品少妇xxxxⅹ| 亚洲欧美色一区二区三区| 精品少妇一区二区三区 | 少妇又紧又色又爽又刺激的视频| 91精品一区在线观看| 久99久视频| 精品亚洲午夜久久久久91| xxxx18日本护士高清hd| 一区二区三区国产精品视频 | 亚洲精品老司机| 亚洲精品日本无v一区| 欧美精品六区| 国产免费一区二区三区四区五区 | 国产午夜精品一区| 欧美日韩一区二区三区69堂| 夜夜嗨av一区二区三区中文字幕| 久久一二区| freexxxx性| 欧美日韩一区二区三区69堂| 狠狠综合久久av一区二区老牛| 日韩av在线影视| 欧美一区二区性放荡片| 欧美精品免费看| 99精品一区| 97久久精品人人澡人人爽| 国产精品久久二区| 亚洲区日韩| 欧美日韩三区| 日日夜夜精品免费看| 国产伦精品一区二区三区照片91| 中文字幕欧美另类精品亚洲| 精品国产二区三区| aaaaa国产欧美一区二区| 久久国产视屏| 综合国产一区| 国产一区免费在线| 狠狠色噜噜狠狠狠狠69| 久久九九亚洲| 亚洲精品国产suv| 日韩av中文字幕第一页| 午夜剧场一区| 香港三日本8a三级少妇三级99| 一区二区三区中文字幕| 午夜av在线电影| 国产欧美视频一区二区| 国产欧美一区二区三区精品观看| 午夜av免费观看| 欧美三级午夜理伦三级老人| 亚洲一级中文字幕| 国产1区2区3区| 欧美一区二三区| 香蕉视频在线观看一区二区| 在线观看黄色91| 欧美精品日韩| 国产99视频精品免费视频7| 国产偷久久一区精品69| 日韩av一区不卡| 日韩av在线网址| 欧美一区二区三区激情视频| 91黄在线看 | 久久精品国产精品亚洲红杏| 国产在线不卡一区| 99日韩精品视频| 国产高清在线一区| 国产精品日韩视频| 97精品国产97久久久久久免费| 国产精品一区二区av日韩在线| 理论片高清免费理伦片| 国产精品香蕉在线的人| 亚洲精品无吗| 欧美在线精品一区| 日本高清h色视频在线观看| 国产精品日产欧美久久久久| 欧美精品日韩一区| 老太脱裤子让老头玩xxxxx| 国产一区免费播放| 高清欧美精品xxxxx在线看| 午夜精品999| 国产91综合一区在线观看| 精品国产九九九| 欧美日韩中文不卡| 久久国产这里只有精品| 午夜一级免费电影| 91精品久久久久久综合五月天| 狠狠色狠狠色88综合日日91| 亚洲乱小说| 三级午夜片| 又黄又爽又刺激久久久久亚洲精品 | 日韩中文字幕久久久97都市激情| 午夜av男人的天堂| 午夜影皖精品av在线播放| 国产精品美女久久久另类人妖| 午夜激情电影院| 久久久久国产亚洲日本| 亚洲欧美另类综合| 一区二区欧美精品| 久久99精品久久久野外直播内容| 精品videossexfreeohdbbw| 欧美hdxxxx| 美国三级日本三级久久99| 一区精品二区国产| 91精品啪在线观看国产线免费| 国产日韩精品一区二区| 粉嫩久久99精品久久久久久夜| 国产在线精品二区| 国产欧美一区二区三区在线| 国产午夜精品一区| 强制中出し~大桥未久在线播放| 国产一区二区伦理| 欧美一区二区三区激情视频| 日本伦精品一区二区三区免费| 日本一区二区三区在线视频| 国产v亚洲v日韩v欧美v片| 国产1区2区3区中文字幕| 亚洲理论影院| 亚洲国产精品97久久无色| 午夜国产一区二区| 国产综合亚洲精品| 亚洲**毛茸茸| 国产午夜亚洲精品羞羞网站| 97久久国产亚洲精品超碰热| 欧美日本91精品久久久久| 精品国产一区二区三区麻豆免费观看完整版 | 精品国产乱码一区二区三区在线| 国产精品一区二区中文字幕| 欧美乱战大交xxxxx| 7777久久久国产精品| 麻豆91在线| 91精品第一页| 在线观看国产91| 欧美日韩三区二区| 久久国产欧美一区二区免费| 一本久久精品一区二区| 国产一级自拍片| 国产精品一级片在线观看| 国产99久久久精品视频| 国产一区二区四区| 国产视频一区二区不卡 | 免费看大黄毛片全集免费| 精品国产品香蕉在线| 狠狠色噜噜狠狠狠狠视频| 国产一区二区a| 欧美日本三级少妇三级久久| 中文字幕制服丝袜一区二区三区| 蜜臀久久99精品久久久| 免费看片一区二区三区| 国内视频一区二区三区| 国产精品一级在线| 午夜爽爽爽男女免费观看| 精品国产二区三区| 免费久久一级欧美特大黄| 久久综合国产精品| 国产欧美一区二区精品性| 国产第一区二区| 欧美一区二区在线不卡| 精品国产一区在线| 久久精品国产一区二区三区| 国产精品一区二区av麻豆| 91午夜精品一区二区三区| 国产女人与拘做受免费视频| 鲁丝一区二区三区免费观看| 国产精品美乳在线观看| 亚洲精品久久久久玩吗| 午夜av在线电影| 国产精品免费观看国产网曝瓜| 亚洲精品国产suv| 久久精品国产99|