日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]用于網頁爬取的數據處理方法及裝置有效

專利信息
申請號: 201410779304.2 申請日: 2014-12-15
公開(公告)號: CN104537005B 公開(公告)日: 2018-04-06
發明(設計)人: 李慶 申請(專利權)人: 北京國雙科技有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京康信知識產權代理有限責任公司11240 代理人: 吳貴明,張永明
地址: 100086 北京市海淀區*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 用于 網頁 數據處理 方法 裝置
【說明書】:

技術領域

發明涉及互聯網領域,具體而言,涉及一種用于網頁爬取的數據處理方法及裝置。

背景技術

隨著互聯網的興起,網絡中存在中大量的信息,與此同時,垂直網絡爬蟲也應運而生,垂直網絡爬蟲是一個自動下載的網頁程序,它根據既定的抓取目標,有選擇性的訪問特定網頁與相關鏈接,獲取所需要的信息。與通用爬蟲不同,垂直爬蟲,抓取與某一特定主題相關的網頁,為面向主題的用戶查詢準備數據資源。

因此,垂直爬蟲,會根據前端的配置定期的抓取特定網頁的信息資源,但是在實際爬蟲的執行的過程中,可能存在對某一網站資源抓取奔潰的情況。如何在多次對同一網站爬取時導致的崩潰問題及時處理并反應給系統處理人員,是當前需要解決的問題。

傳統的網絡爬蟲在解決爬蟲崩潰問題上會將崩潰信息記錄日志或者異常觸發機制已郵件的形式發送給系統管理人員。但是,傳統記錄日志的方式不能夠對定期爬取的爬蟲頻繁奔潰進行處理,而異常觸發機制需要系統人員對頻繁奔潰的爬蟲手工結束。

針對相關技術中解決爬蟲頻繁崩潰占用大量系統資源的問題,目前尚未提出有效的解決方案。

發明內容

本發明的主要目的在于提供一種用于網頁爬取的數據處理方法及裝置,以在一定程度上解決了相關技術中解決爬蟲崩潰問題的處理方式導致的爬取數據效率低的問題。

為了實現上述目的,根據本發明實施例的一個方面,提供了一種用于網頁爬取的數據處理方法。根據本發明的網頁爬取的數據處理方法包括:在啟動爬取程序之后,獲取所述爬取程序當前爬取的網站的狀態標志位;確定所述狀態標志位指示的爬取狀態;若所述狀態標志位指示的所述爬取狀態為中斷爬取狀態,則判斷數據庫中記錄的當前崩潰次數是否小于預設崩潰閾值;若所述當前崩潰次數不小于所述預設崩潰閾值,則終止所述爬取程序的工作;若所述當前崩潰次數小于所述預設崩潰閾值,則控制所 述爬取程序繼續工作。

進一步地,啟動爬取程序包括:使用正在爬取狀態的第一標識設置所述數據庫中的所述當前爬取的網站的狀態標志位;在啟動爬取程序之后,所述數據處理方法還包括:若所述爬取程序返回的數據為異常數據,則判斷出所述爬取程序崩潰,使用所述中斷爬取狀態的第二標識修改所述當前爬取的網站的狀態標志位,并將所述數據庫中記錄的所述當前爬取的網站的當前崩潰次數加一。

進一步地,在啟動爬取程序之后,所述數據處理方法還包括:若所述爬取程序爬取所述網站的所有網絡資源地址返回的數據均未出現異常,則確定所述爬取程序成功爬取所述網站,使用正在爬取狀態的第二第一標識設置將所述網站的狀態標志位。

進一步地,在判斷出所述爬取程序崩潰之后,所述數據處理方法還包括:讀取所述異常數據中的錯誤代碼;獲取所述錯誤代碼的爬取崩潰信息,并輸出所述爬取崩潰信息。

進一步地,若所述當前崩潰次數不小于所述預設崩潰閾值,在終止所述爬取程序的工作的同時,所述數據處理方法還包括:使用終止爬取狀態的第三標識設置所述當前爬取的網站的狀態標志位;若所述當前崩潰次數小于所述預設崩潰閾值,在控制所述爬取程序繼續工作的同時,所述處理方法還包括:使用正在爬取狀態的第二標識設置所述當前爬取的網站的狀態標志位。

進一步地,在確定所述狀態標志位指示的爬取狀態之后,所述數據處理方法還包括:若所述狀態標志位指示的爬取狀態為正在爬取狀態或終止爬取狀態,則控制所述爬取程序繼續工作。

為了實現上述目的,根據本發明實施例的另一方面,提供了一種用于網頁爬取的數據處理裝置。根據本發明的用于網頁爬取的數據處理裝置包括:獲取模塊,在啟動爬取程序之后,用于獲取所述爬取程序當前爬取的網站的狀態標志位;確定模塊,用于確定所述狀態標志位指示的爬取狀態;判斷模塊,在所述確定裝置確定的所述爬取狀態為中斷爬取狀態的情況下,用于判斷數據庫中記錄的當前崩潰次數是否小于預設崩潰閾值;終止模塊,在所述判斷模塊的判斷結果為否的情況下,用于終止所述爬取程序的工作;第一控制模塊,在所述判斷模塊的判斷結果為是的情況下,用于控制所述爬取程序繼續工作。

進一步地,所述數據處理裝置還包括:啟動模塊,用于使用正在爬取狀態的第一標識設置所述數據庫中的所述當前爬取的網站的狀態標志位,啟動爬取程序;所述數據處理裝置還包括:修改模塊,在所述爬取程序返回的數據為異常數據的情況下,用于判斷出所述爬取程序崩潰,使用所述中斷爬取狀態的第二標識修改所述當前爬取的 網站的狀態標志位,并將所述數據庫中記錄的所述當前爬取的網站的當前崩潰次數加一。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410779304.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 99精品国产99久久久久久97| 搡少妇在线视频中文字幕| 亚洲国产精品日韩av不卡在线| 在线国产一区二区| 午夜电影一区二区三区| 欧美日韩国产在线一区二区三区 | 91黄在线看| 久久久久国产精品视频| 欧美一区二区三区黄| 精品videossexfreeohdbbw| 国产乱一区二区三区视频| 亚洲区在线| 少妇高潮一区二区三区99小说| 欧美乱大交xxxxx古装| 国产91精品高清一区二区三区| 欧美一区二区三区久久久| 久久福利视频网| 国产在线精品区| 久久久综合香蕉尹人综合网| 国产欧美综合一区| 国产免费一区二区三区网站免费 | 国产日韩欧美在线一区| 91超碰caoporm国产香蕉| 精品久久一区| 欧美精品日韩| 91麻豆精品国产自产欧美一级在线观看 | 国产欧美日韩一区二区三区四区| 亚洲自偷精品视频自拍| 亚洲精品www久久久| 制服丝袜视频一区| 国产精品欧美一区二区视频| 欧美在线精品一区| 中文天堂在线一区| 国产在线一区二区视频| 李采潭伦理bd播放| 国产欧美亚洲精品| 国产福利一区在线观看| 日韩av在线资源| 久久夜色精品国产噜噜麻豆| 国产床戏无遮挡免费观看网站 | 精品久久久久一区二区| 亚洲高清毛片一区二区| 91麻豆精品国产91久久| 狠狠躁日日躁狂躁夜夜躁av| 欧美大成色www永久网站婷| 欧美日韩激情在线| 亚洲高清国产精品| 欧美日韩激情一区二区| 美女啪啪网站又黄又免费| 亚洲神马久久| 年轻bbwbbw高潮| 欧美日韩久久一区二区| 国产午夜精品一区理论片飘花 | 毛片免费看看| 国产精品亚洲精品| 欧美一区二区三区精品免费| 狠狠色噜噜狠狠狠狠黑人| 国产精品一二三在线观看| 毛片大全免费看| 国产综合亚洲精品| 国产一级片子| 毛片大全免费观看| 国产一区二区资源| 欧美一区二区三区国产精品| 国产一区二区三区网站| 国产天堂第一区| 国产偷窥片| 国产欧美三区| 女人被爽到高潮呻吟免费看 | 欧美日韩激情一区| 国产精品禁18久久久久久| 欧美日韩一区不卡| 国产一区在线免费| 国产精品美女www爽爽爽视频| 国产精品中文字幕一区二区三区| 狠狠色狠狠色综合日日五| 99久久久久久国产精品| aaaaa国产欧美一区二区| 欧美精品中文字幕亚洲专区| 日本一区二区三区在线看| 福利片一区二区三区| 91精品一区二区中文字幕| 国产精品一区二| 国产欧美日韩综合精品一| 国产精品亚洲精品| 国产又黄又硬又湿又黄| 日韩欧美多p乱免费视频| 小萝莉av| 国产91一区二区在线观看| 国产激情视频一区二区| 国产99网站| 亚洲国产精品一区在线| 国产中文字幕91| 国产精品99一区二区三区| 国产国产精品久久久久| 久久精品亚洲精品国产欧美| 国产大片一区二区三区| 欧美系列一区| 亚洲欧美国产精品久久| 欧美资源一区| 欧美日韩一区二区三区69堂| 亚洲欧洲日韩av| 国产91在线播放| 国产精品一级在线| 国产毛片精品一区二区| 久久aⅴ国产欧美74aaa| 欧美日韩国产一区二区三区在线观看| 99国精视频一区一区一三| 99久久久国产精品免费无卡顿| 91精品国产91热久久久做人人| 蜜臀久久99精品久久久| 日韩av片无码一区二区不卡电影| 国产亚洲精品久久yy50| 亚洲欧美日韩精品suv| 国产精品区一区二区三| 亚洲1区在线观看| 91国偷自产一区二区介绍| 午夜电影院理论片做爰| 综合久久一区二区三区| 午夜666| 亚洲视频精品一区| 性欧美激情日韩精品七区| 欧美精品xxxxx| 国产精品久久国产精品99 | 亚洲精品一区在线| 午夜影院一区二区| 狠狠躁日日躁狂躁夜夜躁av| 中文字幕a一二三在线| 日本精品一区二区三区在线观看视频| 欧美精品第一区| 一区二区在线视频免费观看| 欧美老肥婆性猛交视频| 国产精品亚洲一区二区三区| 日本护士hd高潮护士| 中文字幕一二三四五区| 国产精品电影一区二区三区| 日韩午夜电影院| 国产婷婷一区二区三区久久| ass美女的沟沟pics| 右手影院av| 91人人爽人人爽人人精88v| 国产精品综合在线| 日韩精品999| 午夜剧场一区| 日本神影院一区二区三区| 欧美日韩国产精品一区二区| 亚洲精品国产久| 69久久夜色精品国产7777| 午夜精品一二三区| 狠狠色狠狠色很很综合很久久| 国产欧美视频一区二区| 久久精品亚洲精品国产欧美| 午夜影院激情| 男女午夜影院| 日韩av在线免费电影| 99久久久久久国产精品| 国产在线观看免费麻豆| 日韩精品久久一区二区| 欧美日韩九区| 91麻豆文化传媒在线观看| 2023国产精品自产拍在线观看| 亚洲精品无吗| 欧美精品一级二级| 日韩中文字幕亚洲欧美| xxxx在线视频| 欧美日韩一区不卡| 男人的天堂一区二区| 69精品久久| 国产在线精品一区二区在线播放| 91avpro| 国产亚洲精品久久777777 | 亚欧精品在线观看| 国产91丝袜在线播放动漫| 久久99精| 久久综合伊人77777麻豆最新章节| 欧美亚洲视频一区二区| 玖玖玖国产精品| 午夜大片网| 99国产精品9| 国产乱淫精品一区二区三区毛片| 久久国产中文字幕| 在线观看国产91| 一区二区三区欧美精品| 国产69精品久久久久孕妇不能看 | 亚洲欧美一卡二卡| 91精品黄色| 亚洲精品久久久久999中文字幕 | 国产精品亚发布| 亚洲欧美日韩综合在线| 男人的天堂一区二区| 99爱精品视频| 浪潮av色| 99国产精品免费| 91精品免费观看| 精品一区二区三区中文字幕| 亚日韩精品| 国产亚洲精品久久久456| 国产在线拍偷自揄拍视频 | 久久综合伊人77777麻豆最新章节 一区二区久久精品66国产精品 | 欧美在线播放一区| 男女午夜爽爽| 国产三级国产精品国产专区50| 欧美高清xxxxx| 一区二区欧美精品| 精品国产伦一区二区三区免费| 日本aⅴ精品一区二区三区日| 国产一区正在播放| 国内精品久久久久久久星辰影视| 国语对白一区二区三区| 国产伦精品一区二区三| 亚洲欧美国产一区二区三区| 欧美一级久久精品| 日本xxxxxxxxx68护士| 91精品国产综合久久婷婷香| 免费观看xxxx9999片| 国产精品久久久久久久久久久不卡| 欧美系列一区二区| 激情久久精品| 日韩欧美国产另类| 国产性生交xxxxx免费| 久久99国产精品久久99果冻传媒新版本| 91片在线观看| 色婷婷精品久久二区二区我来| 91国偷自产中文字幕婷婷| 免费的午夜毛片| 91一区二区三区视频| 国产精品无码永久免费888| 欧美视频1区| 97久久精品一区二区三区观看| 精品综合久久久久| 毛片大全免费观看| 99久精品视频| 午夜电影院理论片做爰| 国产精品欧美一区二区三区奶水| 羞羞免费视频网站| 国产精品一区二区日韩新区| 亚日韩精品| 国产精品1区二区| 国语对白一区二区三区| 91狠狠操| 欧美性猛交xxxxxⅹxx88| 日韩欧美一区二区在线视频| 一区二区三区香蕉视频| 99三级视频| 国产vsv精品一区二区62| 好吊妞国产欧美日韩软件大全|