日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]防假死爬蟲系統的構建方法無效

專利信息
申請號: 200910080438.4 申請日: 2009-03-18
公開(公告)號: CN101504665A 公開(公告)日: 2009-08-12
發明(設計)人: 楊溥;郭軍;徐蔚然 申請(專利權)人: 北京郵電大學
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 暫無信息 代理人: 暫無信息
地址: 100876*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 假死 爬蟲 系統 構建 方法
【說明書】:

技術領域

發明涉及網絡數據采集系統的構建方法,尤其涉及一種防假死爬蟲系統的構建方法。

背景技術

人類步入信息時代,信息爆炸,越來越多鋪天蓋地的信息壓得人喘不過氣來。在這種狀況下,人們為了快捷地抽出有用的信息從而提高工作、學習等效率,提出并實現了搜索引擎。作為搜索引擎的基礎和搜索引擎處理的數據的唯一來源,爬蟲系統的地位和重要性漸漸突顯。不同于其他的搜索引擎部件,爬蟲是和網絡、存儲密切相關的,這樣就導致外部環境對于爬蟲的健壯性起到深刻的影響。現行一般的搜索引擎爬蟲系統的健壯性很差,不能適應網絡環境和硬件環境多樣性,因此導致各種不能正常通信和許多沒有必要的等待時間,即導致爬蟲的假死狀態,浪費大量的時間和犧牲相當一部分的效率。怎樣做到爬蟲系統具有防假死功能已受到越來越多的學者的關注。目前,還沒有一種系統的行之有效的防假死爬蟲系統的構建方法。

爬蟲系統不同于搜索引擎的其他部件系統,鑒于其與網絡、存儲密切相關的性質,為了有效地解決爬蟲系統的假死狀態,本發明從網絡環境和存儲環境出發,從根源上有效地解決爬蟲系統的假死狀態。

發明內容

針對現有技術存在的問題,本發明的目的是提供一種防假死爬蟲系統的構建方法。

為達到上述目的,本發明的方法包括下列步驟:

(1)檢測處理被請求網頁;

(2)檢測處理網絡響應;

(3)檢測處理存儲空間;

(4)重復執行步驟(1),(2)和(3),直到網頁超鏈接全部處理完為止。

上述方法中,步驟(1)進一步包括:

(11)向服務器請求網頁;

(12)檢測被請求網頁是否存在;

(13)若被請求網頁存在,則提取和存儲超鏈接;若被請求網頁不存在,則執行步驟(4)。

上述方法中,步驟(2)進一步包括:

(21)檢測獲取網頁的網絡響應是否太久;

(22)若獲取網頁的網絡響應是太久,則執行步驟(23);若獲取網頁的網絡響應不是太久,則執行步驟(3);

(23)檢測重試次數是否到達設定值;

(24)若檢測重試次數到達設定值,則執行步驟(4);若檢測重試次數沒有到達設定值,則執行步驟(25);

(25)重試獲取網頁,執行步驟(21)。

上述方法中,步驟(3)進一步包括:

(31)檢測存儲空間是否不足;

(32)若存儲空間不足,則特殊處理;若存儲空間沒有不足,則存儲網頁。

上述方法中,步驟(4)進一步包括:

(41)檢測網頁超鏈接是否全部處理;

(42)若網頁超鏈接沒有全部處理,則執行步驟(43);若網頁超鏈接是全部處理,則結束;

(43)獲得下一個超鏈接,執行步驟(44);

(44)執行步驟(1)。

本發明的有益效果在于,通過應用本發明所描述的方法,可以有效地防止爬蟲系統假死狀態的發生;可以顯著地減少爬蟲系統等待時間和提高爬蟲系統的爬抓效率;可以為搭建具有健壯性的爬蟲系統提供通用的框架,有效地降低系統開發成本。

結合附圖,本發明的其他特點和優點可以從下面通過舉例來對本發明的原理進行解釋的優選實施方式的說明中變得更清楚。

附圖說明

圖1是根據本發明的一個實施方式的方法的流程圖。

具體實施方式

下面將結合附圖對本發明的具體實施方式進行詳細描述。

圖1是根據本發明的一個實施方式的方法的流程圖。該流程開始于步驟101。然后在步驟102中,向服務器請求網頁。需要說明的是起始超鏈接應當是包含超鏈接豐富的web網頁,如網站的首頁等,這僅僅是最優舉例,起始超鏈接的不同不構成對本發明的限制。

向服務器請求網頁,一種實施方式是通過HTTP協議GET方法,即通過給服務器發送GET請求信息,來希望獲得URL所指定的網頁。以上是向服務器請求網頁的一個實施例,其他不同的實施例子不構成對本發明的限制。

步驟102之后,流程進入步驟103。

在步驟103,檢測被請求網頁是否存在。一個實施例是通過檢測服務器響應后返回的狀態碼來確定被請求網頁是否存在。在步驟102中通過HTTP協議GET方法給服務器發送請求信息后,服務器會響應并返回一個狀態碼,若狀態碼為404(NotFound),則說明被請求網頁不存在;若狀態碼不為404(NotFound),則說明被請求網頁存在。以上是檢測被請求網頁是否存在的一個實施例,其他不同的實施例子不構成對本發明的限制。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200910080438.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: aaaaa国产欧美一区二区| 国产色婷婷精品综合在线播放| 午夜av电影网| 国产视频一区二区不卡| 少妇高潮大叫喷水| 精品国产一二区| 国产91麻豆视频| 国产欧美日韩一区二区三区四区| 久久国产精品首页| 国产99小视频| 日韩无遮挡免费视频| 国产精品综合在线| 亚洲欧美色图在线| 欧美日韩精品影院| 午夜理伦影院| 久久噜噜少妇网站| 久久影院一区二区| 色婷婷综合久久久中文一区二区| 国产日产欧美一区| 精品91av| 久久久久久久国产精品视频| 日本不卡精品| 夜夜爱av| 精品久久久久99| 国产精品免费一视频区二区三区| 国产精品一二三区视频网站| 香蕉视频在线观看一区二区| 欧美激情精品久久久久久免费 | 视频一区二区国产| 国产69精品久久久久777| 欧美一区二区三区日本| 国产精品99999999| av午夜在线观看| 国产精品一区二区久久乐夜夜嗨 | 国产精品久久免费视频在线| 欧美日韩一区二区三区在线播放| 国产午夜一区二区三区| 国内精品国产三级国产99| 一区二区在线不卡| 久久精品一二三| 一区二区欧美精品| 国产69精品久久99不卡免费版| 国产午夜一区二区三区| 99精品区| 亚洲三区在线| 国产不卡网站| 欧美日韩中文字幕一区| 日本午夜精品一区二区三区| 日韩精品免费播放| 亚洲二区在线播放视频| 国产精品对白刺激在线观看| 国产精品一区二区在线看| 欧美精品一区二区三区在线四季| 久久久综合香蕉尹人综合网| 国产资源一区二区三区| 久久91久久久久麻豆精品| 欧美中文字幕一区二区| 一区二区三区欧美精品| **毛片在线| 精品国产区| 免费欧美一级视频| 精品久久二区| 久久久久久久久亚洲精品| 国产精品久久久久久久久久久新郎 | 日本精品视频一区二区三区| 久久久久国产一区二区三区不卡| 国产精品欧美久久| 特高潮videossexhd| 国产二区三区视频| 精品国产九九| 国产精品理人伦一区二区三区| 午夜精品一二三区| 午夜天堂电影| 久久99精| 国产一级一片免费播放| 国产精品久久久久久久新郎| 欧美国产在线看| 欧美激情在线免费| 欧美精品久久一区| 国产精品二区一区二区aⅴ| 久久综合二区| 午夜免费av电影| 日韩有码一区二区三区| 欧美精品一区久久| 亚洲二区在线播放视频| 色综合久久久久久久粉嫩| 精品国产一区二区三区久久久久久 | 欧美日韩激情一区二区| 国产精品乱码久久久久久久| 午夜看片网址| 国产精品国产三级国产专区55| 亚洲国产精品日韩av不卡在线| 久久国产欧美一区二区三区免费| 在线播放国产一区| 久久久久久久亚洲国产精品87| 狠狠色噜噜狠狠狠合久| 精品国产鲁一鲁一区二区三区| 欧美日韩激情一区二区| 国产精品一区不卡| 激情欧美一区二区三区| 久久激情图片| 欧美日韩中文国产一区发布| 亲子乱子伦xxxx| 亚洲欧美国产中文字幕| 婷婷午夜影院| 国产精品久久久久久久久久久久久久不卡| 视频一区二区中文字幕| 国产伦精品一区二区三区四区| 国产精品v一区二区三区| 91精品一区二区中文字幕| 国产精品日韩视频| 91精品高清| 久久夜色精品久久噜噜亚| 热99re久久免费视精品频软件| free性欧美hd另类丰满| 26uuu色噜噜精品一区二区| 国模精品免费看久久久| 色综合久久网| 91秒拍国产福利一区| 6080日韩午夜伦伦午夜伦| 女人被爽到高潮呻吟免费看| 国产精品免费自拍| 国产精品天堂网| 99国产精品99久久久久久粉嫩| 国产69精品久久久久久| 亚洲二区在线播放视频| 97精品久久久午夜一区二区三区| 国产性猛交96| 色狠狠色狠狠综合| 国产精品一区亚洲二区日本三区| 欧美一区二三区| 九一国产精品| 午夜国内精品a一区二区桃色| 亚洲精品久久久久中文字幕欢迎你| 91社区国产高清| 国产精品偷伦一区二区| 一级久久精品| 一区精品二区国产| 国产精品suv一区二区6| 欧美一区二区三区激情| 亚洲国产精品麻豆| 国产偷亚洲偷欧美偷精品| 国产精品一区二区久久乐夜夜嗨| 国产一区二区在| 免费xxxx18美国| 午夜裸体性播放免费观看| 久久综合久久自在自线精品自| av午夜电影| 亚洲少妇中文字幕| 国产91一区| 国产一区在线视频播放| 国产资源一区二区| 日本一区二区三区免费在线| 亚洲精品一区二区三区香蕉| 国产亚洲精品久久久久久久久动漫| 清纯唯美经典一区二区| 国产精品免费一视频区二区三区| 欧美午夜精品一区二区三区| 亚洲精品www久久久久久广东| 国产精品日韩在线观看| 国产乱一区二区三区视频| 国产在线拍揄自揄拍| 欧美日韩激情一区| 欧美日韩九区| 日韩精品在线一区二区三区| 久久国产精久久精产国| 久久人人精品| 97人人模人人爽人人喊38tv| 热re99久久精品国99热蜜月| 国产精品偷乱一区二区三区| 国产精品九九九九九| 国产乱人伦精品一区二区| 欧美精品国产精品| 麻豆精品久久久| 欧美日韩高清一区二区| 日韩精品乱码久久久久久| 久久一级精品视频| 午夜看片在线| 日韩av在线影视| 国产一区二区三区黄| 亚洲欧美一区二区三区1000 | 国产性生交xxxxx免费| 午夜av网址| 国产精品高潮呻吟三区四区 | 欧美视屏一区| 国产精品香蕉在线的人| 国产精品日本一区二区不卡视频 | 欧美一区亚洲一区| 欧美一区二区三区激情| 一本大道久久a久久精品| 狠狠色狠狠色合久久伊人| 国产乱人乱精一区二视频国产精品 | 日韩国产精品一区二区| 国产乱对白刺激在线视频| 91热精品| 日韩精品免费一区| 国产亚洲精品久久午夜玫瑰园 | 国产精品久久久麻豆| 欧美乱偷一区二区三区在线| 在线国产精品一区二区| 国产精品日韩精品欧美精品| 午夜一区二区三区在线观看| 国产欧美久久一区二区三区| 国产黄一区二区毛片免下载| 午夜影院一级片| 影音先锋久久久| 欧美极品少妇xxxxⅹ| 国产精品久久国产三级国电话系列| 国产精品乱战久久久| 91麻豆精品国产91久久久资源速度 | 99精品国产免费久久| 国产午夜精品一区二区三区欧美| 国产精品视频1区2区3区| 午夜特级片| 久久精品国产精品亚洲红杏| 国产精品综合一区二区三区| 99久久国产免费,99久久国产免费大片| 国内久久久| 日韩av在线导航| 久久天天躁夜夜躁狠狠躁2022| 国产精品亚洲二区| 91性高湖久久久久久久久_久久99| 97香蕉久久国产超碰青草软件| 91国产在线看| 亚洲日韩aⅴ在线视频| 国产精品第56页| 国产精品视频一区二区在线观看 | 国产无遮挡又黄又爽免费网站| 国产精品中文字幕一区二区三区 | 国产高潮国产高潮久久久91| 久久综合久久自在自线精品自| 国产一区二区三区乱码| 日韩欧美高清一区二区| 日本高清一二区| 亚洲欧美一区二| 久久精品麻豆| 中文字幕a一二三在线| 国产精品人人爽人人做av片| 精品久久久久久亚洲综合网| 一区二区在线国产| 免费久久一级欧美特大黄| 久久中文一区二区| 美女脱免费看直播| 999久久久国产| 欧美激情在线一区二区三区| 91久久香蕉国产日韩欧美9色|