日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于Scrapy框架的網(wǎng)絡(luò)數(shù)據(jù)的采集方法及裝置有效

專利信息
申請?zhí)枺?/td> 201811444993.6 申請日: 2018-11-29
公開(公告)號: CN109614535B 公開(公告)日: 2021-10-08
發(fā)明(設(shè)計)人: 呂婧;辛北軍;張巖;劉建華;胡向旭;馬宏強 申請(專利權(quán))人: 中電萬維信息技術(shù)有限責(zé)任公司
主分類號: G06F16/951 分類號: G06F16/951
代理公司: 深圳市科吉華烽知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44248 代理人: 胡吉科
地址: 730000 甘*** 國省代碼: 甘肅;62
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 scrapy 框架 網(wǎng)絡(luò) 數(shù)據(jù) 采集 方法 裝置
【說明書】:

發(fā)明涉及一基于Scrapy框架的網(wǎng)絡(luò)數(shù)據(jù)的采集方法及裝置,所述方法包括:基于一代碼固定的Item動態(tài)類,獲取網(wǎng)絡(luò)采集事件中的采集字段;獲取與每一個所述采集字段對應(yīng)的字段內(nèi)容;存儲所述字段內(nèi)容。本發(fā)明對于任意一個網(wǎng)絡(luò)采集事件,均可以采用一個固定的Item動態(tài)類,獲取網(wǎng)絡(luò)采集事件中的采集字段,而不需要在對于不同的網(wǎng)絡(luò)采集事件去對應(yīng)修改Item類,提高采集字段的獲取效率;且對于任何一個網(wǎng)絡(luò)采集事件,其中的采集字段可以靈活配置,沒有局限性。

技術(shù)領(lǐng)域

本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別是涉及一種基于Scrapy框架的網(wǎng)絡(luò)數(shù)據(jù)的采集方法及裝置。

背景技術(shù)

Scrapy是一個開源且較為著名的爬蟲框架,可以應(yīng)用在包括數(shù)據(jù)挖掘,信息處理或存儲歷史數(shù)據(jù)等一系列的程序中。其最初是為了頁面抓取(或者網(wǎng)絡(luò)抓取)所設(shè)計的,也可以應(yīng)用在獲取API所返回的數(shù)據(jù)(例如AmazonAssociates Web Services)或者通用的網(wǎng)絡(luò)爬蟲,主要功能是爬取網(wǎng)站數(shù)據(jù),從非結(jié)構(gòu)性的數(shù)據(jù)源提取結(jié)構(gòu)性數(shù)據(jù)。

Scrapy提供了Item類滿足常用數(shù)據(jù)輸出的需求。Item類可以使用簡單的 class定義語法,其類成員由Field對象聲明而來。Field對象指明了每個字段的元數(shù)據(jù)(metadata),可以為每個字段指明任何類型的元數(shù)據(jù)。

但是針對不同的采集項目,每次在采集時需要都需要修改Item類來適配具體的采集場景,即在不同的采集場景下,需要對應(yīng)修改Item類代碼才可以適用。這種方式對于采集場景較多,任務(wù)較多時,會產(chǎn)生操作繁瑣,工作效率較低的技術(shù)問題。

發(fā)明內(nèi)容

基于此,有必要針對目前在不同采集場景下需要修改Item類的問題,提供一種基于Scrapy框架的網(wǎng)絡(luò)數(shù)據(jù)的采集方法及裝置。

一種基于Scrapy框架的網(wǎng)絡(luò)數(shù)據(jù)的采集方法,包括:

基于一代碼固定的Item動態(tài)類,獲取網(wǎng)絡(luò)采集事件中的采集字段;

獲取與每一個所述采集字段對應(yīng)的字段內(nèi)容;

存儲所述字段內(nèi)容。

在其中一個實施例中,所述基于一代碼固定的Item類,獲取網(wǎng)絡(luò)采集事件中的采集字段之前,所述方法還包括:

定義一代碼固定的Item動態(tài)類,所述Item動態(tài)類包含一通用的采集字段變量,所述變量指向?qū)?yīng)的采集字段對象。

在其中一個實施例中,所述基于一代碼固定的Item動態(tài)類,獲取網(wǎng)絡(luò)采集事件中的采集字段,具體為:

基于一代碼固定的Item動態(tài)類,循環(huán)增加采集域的數(shù)量,遍歷所述網(wǎng)絡(luò)采集事件以獲取所述采集字段。

在其中一個實施例中,所述獲取與每一個所述采集字段對應(yīng)的字段內(nèi)容之后,所述方法還包括:

將與每一個所述采集字段對應(yīng)的字段內(nèi)容添加至目標數(shù)組中;

遍歷所述目標數(shù)組,將讀取的所述目標數(shù)組中與每一個所述采集字段對應(yīng)的字段內(nèi)容拼接成目標字符串;

所述存儲所述字段內(nèi)容,具體為:

存儲包含所述字段內(nèi)容的所述目標字符串。

在其中一個實施例中,所述將與每一個所述采集字段對應(yīng)的字段內(nèi)容添加至目標數(shù)組中,包括:

采用hxs對象讀取所述網(wǎng)絡(luò)采集事件中每個網(wǎng)站中的頁面信息;

通過hxs對象的xpath方法從所述頁面信息中提取與每個所述采集字段對應(yīng)的字段內(nèi)容;

將提取的與每個所述采集字段對應(yīng)的字段內(nèi)容添加至目標數(shù)組中。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中電萬維信息技術(shù)有限責(zé)任公司,未經(jīng)中電萬維信息技術(shù)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201811444993.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 九一国产精品| 97欧美精品| 99爱精品视频| 亚洲高清毛片一区二区| 国产一区二区伦理| 亚洲欧美国产日韩色伦| 性xxxxfreexxxxx交| 亚洲欧洲日韩av| 欧美色综合天天久久| 国产99网站| 免费毛片a| 色天天综合久久久久综合片| 国产视频二区| 精品一区二区三区中文字幕| av午夜影院| 国产麻豆一区二区三区在线观看| 国产欧美日韩一级| 一区二区三区国产精品| 日韩国产不卡| 国产精品爽到爆呻吟高潮不挺| 国产一区二区综合| 综合国产一区| 日本精品三区| 国产精品视频久久久久久久| 国产欧美一区二区三区免费视频| 国产日韩欧美二区| 色狠狠色狠狠综合| 97久久精品人人做人人爽50路| 国产精品1234区| 国产亚洲精品久久久456| 色综合久久88| 国产精品九九九九九九九| 91国偷自产一区二区介绍| 亚洲欧美国产中文字幕| 91精品中综合久久久婷婷| 国产高清精品一区| 日韩av电影手机在线观看| 午夜亚洲影院| 高清欧美精品xxxxx| 国产欧美日韩另类| 国产精品久久人人做人人爽| 国产第一区二区| 亚洲精品国产精品国自| 99精品国产一区二区三区不卡| 久久一区二区三区欧美| 久久久久亚洲最大xxxx| 亚洲国产精品一区二区久久,亚洲午夜| 日韩精品在线一区二区三区| 麻豆91在线| 91区国产| 午夜电影院理论片做爰| 日韩欧美一区二区久久婷婷| 国产又黄又硬又湿又黄| 首页亚洲欧美制服丝腿| 亚洲乱强伦| 国产精品99在线播放| 欧美日韩久久精品| 黄色av中文字幕| 中文字幕一二三四五区| 久久91久久久久麻豆精品| 91国偷自产中文字幕婷婷| 亚洲国产精品一区二区久久hs| 国产伦精品一区二区三| 99国产精品九九视频免费看| 夜夜精品视频一区二区| _97夜夜澡人人爽人人| 久久久久久久亚洲视频| 亚洲欧美国产中文字幕| 中文av一区| 久久一二区| 狠狠色噜噜综合社区| 国产日韩欧美精品一区二区| 国产精品美女久久久免费| 热久久一区二区| 午夜黄色一级电影| 欧美一区久久| 午夜剧场伦理| 国产精品一二三区视频出来一| 中文在线一区二区三区| 欧美色图视频一区| 亚洲乱码av一区二区三区中文在线:| 国产精品一二三在线观看| 日韩一区高清| 色婷婷噜噜久久国产精品12p| 亚洲欧美日韩另类精品一区二区三区| 久久国产精品欧美| 中文字幕一区二区三区乱码视频| 精品国产一区二| 日韩av在线中文| 久久久精品二区| 国产精品国产三级国产专区52| 91看片片| 国产一区二区午夜| 国产免费第一区| 国产二区三区视频| 精品国产乱码久久久久久久久| 国产一区二区黄| 欧美高清xxxxx| 国产精品久久久综合久尹人久久9| 国产人澡人澡澡澡人碰视| 国产精品偷伦一区二区| 日本五十熟hd丰满| 日本午夜久久| 羞羞免费视频网站| 午夜理伦影院| 久久激情图片| 91麻豆精品国产自产欧美一级在线观看| 国产亚洲精品精品国产亚洲综合 | 午夜影院黄色片| 国产区二区| 欧美精品在线观看视频| 亚洲精品久久久中文| 欧美一区二区三区视频在线观看| 亚洲精品日韩在线| 国产激情视频一区二区| 欧美日韩国产色综合视频| 97精品国产97久久久久久| 国产91免费在线| 91精品资源| xxxxx色| 欧美三区视频| 久久精品综合| 久久精视频| 国产精品国产三级国产播12软件 | 综合欧美一区二区三区 | 夜夜精品视频一区二区| 一区二区在线视频免费观看 | 日韩一级片在线免费观看| 亚洲国产精品一区在线| 日韩一区二区三区福利视频| 91精品啪在线观看国产线免费| 日韩av三区| 国产91色综合| 999久久久国产| 精品国产亚洲一区二区三区| 少妇自拍一区| 欧美一级久久精品| 精品国产免费久久| 国产日产欧美一区二区| 国产一区日韩在线| 国产精品久久二区| 狠狠插狠狠爱| 国产二区三区视频| 国产天堂一区二区三区| 欧美精品一区二区三区久久久竹菊| 国产人成看黄久久久久久久久 | 91精品国产综合久久福利软件| 一区二区三区四区视频在线| 香蕉av一区二区三区| 国产一区二区三区四| 久久不卡一区| 精品国产一区二区三| 国产高清一区二区在线观看| 性色av色香蕉一区二区三区| 一级女性全黄久久生活片免费| 久久人人97超碰婷婷开心情五月| 国产精品免费一区二区区| 国产精品久久免费视频在线| 中文字幕在线播放一区| 日韩欧美国产第一页| 99国产精品99久久久久久粉嫩| 躁躁躁日日躁网站| 日本久久丰满的少妇三区| 国产第一区二区三区| 欧美xxxxhdvideos| 91精品夜夜| 91麻豆精品国产91久久| 中文字幕欧美一区二区三区| 久久99精| 色一情一交一乱一区二区三区| 欧美亚洲精品一区二区三区| 少妇中文字幕乱码亚洲影视| 99久久夜色精品国产网站| 国产精品一区二区麻豆| 午夜爱爱电影| 爱看av在线入口| 日本神影院一区二区三区| 亚洲码在线| 欧美日韩一区二区三区四区五区 | 日本一码二码三码视频| 国产精品欧美一区二区三区| 午夜av电影网| 国产精品国产三级国产播12软件| 久久精品综合视频| 好吊妞国产欧美日韩免费观看网站| 日韩欧美视频一区二区| 国产精品亚州| 欧美在线一区二区视频| 91精品综合| 福利片一区二区三区| 欧美精品一区二区三区视频| 国产精品免费一视频区二区三区| 精品无码久久久久国产| 色综合久久88| 国产欧美日韩在线观看| 国产在线精品二区| 日韩精品中文字幕一区二区三区 | 精品国产一区二区三区麻豆免费观看完整版 | 91婷婷精品国产综合久久| 2023国产精品自产拍在线观看| 亚洲自偷精品视频自拍| 欧美一区二区三区久久精品| 四季av中文字幕一区| 国产欧美一区二区三区在线看| 99热久久这里只精品国产www| 一区二区欧美在线| 国产午夜精品av一区二区麻豆| 秋霞av电影网| 免费xxxx18美国| 国产欧美久久一区二区三区| 欧美日韩激情一区二区| 欧美日韩三区二区| 97一区二区国产好的精华液| 在线播放国产一区| 猛男大粗猛爽h男人味| 午夜毛片在线| 日韩夜精品精品免费观看| 黄色av中文字幕| 国产精品1区二区| 99爱精品视频| 日韩欧美高清一区| 欧美一区二区精品久久| 国产中文字幕91| 理论片高清免费理伦片| 一区精品二区国产| 亚洲欧美日韩在线看| 亚洲国产视频一区二区三区| 久久精品综合| 亚洲精品www久久久| 国产精品偷拍| 精品无人国产偷自产在线| 国产午夜一区二区三区| 国产淫片免费看| 26uuu亚洲国产精品| 久久免费视频一区| 精品国产91久久久| 一区二区三区欧美日韩| 91久久免费| 美女脱免费看直播| 激情久久精品| 欧美日韩一级二级三级| 欧美乱妇在线观看| 国产一区二区免费电影| 夜夜躁日日躁狠狠久久av| 国产又黄又硬又湿又黄| 欧美精品在线一区二区|