日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于腳本引擎的數(shù)據(jù)采集方法和裝置無效

專利信息
申請?zhí)枺?/td> 201310019623.9 申請日: 2013-01-18
公開(公告)號: CN103092817A 公開(公告)日: 2013-05-08
發(fā)明(設計)人: 侯賦文 申請(專利權)人: 五八同城信息技術有限公司
主分類號: G06F17/20 分類號: G06F17/20
代理公司: 工業(yè)和信息化部電子專利中心 11010 代理人: 齊潔茹
地址: 300457 天津市濱海新區(qū)第一*** 國省代碼: 天津;12
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 腳本 引擎 數(shù)據(jù) 采集 方法 裝置
【權利要求書】:

1.一種基于腳本引擎的數(shù)據(jù)采集方法,其特征在于,包括:

步驟1,加載預先配置的與當前采集任務相對應的采集配置文件,解析該采集配置文件,獲取目標數(shù)據(jù)采集規(guī)則;其中,所述目標數(shù)據(jù)采集規(guī)則包括目標數(shù)據(jù)類型以及采集各類目標數(shù)據(jù)對應的腳本方法名稱和腳本語言;

步驟2,初始化支持不同腳本語言的各腳本引擎,并加載預先配置的由采集目標數(shù)據(jù)的腳本方法構成的腳本文件;

步驟3,下載網(wǎng)頁數(shù)據(jù),并查找定義在該網(wǎng)頁上需要采集的目標數(shù)據(jù)的采集規(guī)則,將下載的網(wǎng)頁數(shù)據(jù)和查找到的采集規(guī)則中配置的腳本方法名稱發(fā)送至相應腳本語言的腳本引擎;

步驟4,腳本引擎根據(jù)所述腳本方法名稱,調(diào)用并執(zhí)行對應的腳本方法,在所述網(wǎng)頁數(shù)據(jù)中采集出目標數(shù)據(jù)。

2.如權利要求1所述的方法,其特征在于,根據(jù)采集任務需求,所述腳本方法中定義有目標數(shù)據(jù)抽取、清洗、加工和轉換規(guī)則。

3.如權利要求2所述的方法,其特征在于,所述目標數(shù)據(jù)抽取規(guī)則包括:按照正則匹配法定義的抽取規(guī)則進行抽取、按照標記截取法定義的抽取規(guī)則進行抽取、按照Xpath抽取法定義的抽取規(guī)則進行抽取、或者按照插件定制法定義的抽取規(guī)則進行抽取。

4.如權利要求2或3所述的方法,其特征在于,所述步驟4中,執(zhí)行對應的腳本方法在網(wǎng)頁數(shù)據(jù)中采集出目標數(shù)據(jù),具體包括:

按照所述腳本方法定義的抽取規(guī)則,在所述網(wǎng)頁數(shù)據(jù)中抽取出指定的目標數(shù)據(jù),以及按照所述腳本方法中定義的清洗、加工和轉換規(guī)則,對抽取得到的目標數(shù)據(jù)進行清洗、加工和轉換操作,得到所需的目標數(shù)據(jù)。

5.如權利要求1所述的方法,其特征在于,所述目標數(shù)據(jù)類型包括:標題、作者、日期、內(nèi)容。

6.一種基于腳本引擎的數(shù)據(jù)采集裝置,其特征在于,包括:

配置解析模塊,用于加載預先配置的與當前采集任務相對應的采集配置文件,解析該采集配置文件,獲取目標數(shù)據(jù)采集規(guī)則;其中,所述目標數(shù)據(jù)采集規(guī)則包括目標數(shù)據(jù)類型以及采集各類目標數(shù)據(jù)對應的腳本方法名稱和腳本語言;

數(shù)據(jù)處理模塊,用于下載網(wǎng)頁數(shù)據(jù),并查找定義在該網(wǎng)頁上需要采集的目標數(shù)據(jù)的采集規(guī)則,將下載的網(wǎng)頁數(shù)據(jù)和查找到的采集規(guī)則中配置的腳本方法名稱,按腳本語言發(fā)送至腳本引擎模塊中相應的腳本引擎中;

腳本引擎模塊,包括支持不同腳本語言的多個腳本引擎,各腳本引擎在初始化后,加載預先配置的由采集目標數(shù)據(jù)的腳本方法構成的腳本文件,以及在接收到數(shù)據(jù)處理模塊發(fā)送的數(shù)據(jù)后,根據(jù)所述腳本方法名稱,調(diào)用并執(zhí)行對應的腳本方法,在所述網(wǎng)頁數(shù)據(jù)中采集出目標數(shù)據(jù)。

7.如權利要求6所述的裝置,其特征在于,根據(jù)采集任務需求,所述腳本引擎模塊加載的腳本文件中的腳本方法中定義有目標數(shù)據(jù)抽取、清洗、加工和轉換規(guī)則。

8.如權利要求7所述的裝置,其特征在于,所述腳本引擎模塊中,所述目標數(shù)據(jù)抽取規(guī)則包括:按照正則匹配法定義的抽取規(guī)則進行抽取、按照標記截取法定義的抽取規(guī)則進行抽取、按照Xpath抽取法定義的抽取規(guī)則進行抽取、或者按照插件定制法定義的抽取規(guī)則進行抽取。

9.如權利要求7或8所述的裝置,其特征在于,所述腳本引擎模塊,具體用于按照所述腳本方法定義的抽取規(guī)則,在所述網(wǎng)頁數(shù)據(jù)中抽取出指定的目標數(shù)據(jù),以及按照所述腳本方法中定義的清洗、加工和轉換規(guī)則,對抽取得到的目標數(shù)據(jù)進行清洗、加工和轉換操作,得到所需的目標數(shù)據(jù)。

10.如權利要求6所述的裝置,其特征在于,所述配置解析模塊中,目標數(shù)據(jù)類型包括:標題、作者、日期、內(nèi)容。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于五八同城信息技術有限公司,未經(jīng)五八同城信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310019623.9/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91社区国产高清| 国产一区第一页| 国产精品一区二区在线观看免费| 欧美一区二区三区免费视频| 日韩精品一区二区久久| 国产午夜亚洲精品羞羞网站| 在线国产精品一区二区| 综合久久国产九一剧情麻豆| 精品久久久影院| 国产日韩欧美自拍| 黑人巨大精品欧美黑寡妇| 亚洲精品一区中文字幕| 国产精品1区2区| 亚洲无人区码一码二码三码| 国产精品乱码久久久久久久久| 午夜看片在线| 狠狠色噜噜综合社区| 欧美日韩一区二区三区不卡视频| 欧美乱偷一区二区三区在线| 国产日韩一区在线| 天摸夜夜添久久精品亚洲人成| 欧美精品一区二区三区在线四季| 国产理论一区二区三区| 日韩一区二区三区福利视频| 欧美精品在线一区二区| 国产欧美精品一区二区三区-老狼| 国产欧美一区二区在线| 久久99精品一区二区三区| 午夜激情综合网| 国产日产精品一区二区三区| 99久久婷婷国产综合精品草原| 91精品美女| 亚洲国产精品91| 91国产一区二区| 国产一区免费在线| 国产区91| 69久久夜色精品国产7777| 国产午夜一区二区三区| 国语对白一区二区三区| 亚洲欧美一二三| 色婷婷综合久久久中文一区二区| 欧美午夜精品一区二区三区| 国产精品久久久久久久岛一牛影视| 99re久久精品国产| 久久激情图片| 欧美精品第一区| 国产精品一区二区免费| 久久五月精品| 国产vsv精品一区二区62| 91国偷自产一区二区介绍| 美女脱免费看直播| 亚洲一区欧美| 日韩精品久久久久久久电影99爱| 亚洲精品国产精品国产| 欧美xxxxhdvideos| 亚洲精品久久久久999中文字幕| 国产高清在线精品一区二区三区| 国产无套精品久久久久久| 欧美日韩久久一区二区| 亚洲区在线| 91精品视频一区二区| 国产视频一区二区在线播放| 国产vsv精品一区二区62| 激情aⅴ欧美一区二区三区| 国产麻豆一区二区| 色婷婷综合久久久中文一区二区| 亚洲欧美一卡| 日本一区免费视频| 日韩中文字幕一区二区在线视频| 国产精品99久久久久久宅男| 中文字幕a一二三在线| 国产美女三级无套内谢| 蜜臀久久99精品久久一区二区| 欧美日韩偷拍一区| 久久99久久99精品免观看软件| 91精品系列| 午夜天堂电影| 99久久精品一区字幕狠狠婷婷| 欧美3级在线| 精品国产一区二区在线| 996久久国产精品线观看| 综合久久激情| 午夜一级电影| 视频一区二区中文字幕| 久久中文一区| 在线精品国产一区二区三区| 天堂av一区二区三区| 久久久综合亚洲91久久98| 中文丰满岳乱妇在线观看| 李采潭伦理bd播放| 亚洲欧美一卡| 91精品国产综合久久福利软件| 午夜国产一区二区三区四区| 日本xxxx护士高潮hd| 国产欧美日韩亚洲另类第一第二页| 国产伦理精品一区二区三区观看体验| 国产视频1区2区| 亚洲国产精品一区在线| 99久久国产综合精品尤物酒店| 国产在线一区二区视频| 国产精品一区二| 国产精品久久二区| 国产欧美久久一区二区三区| 国产电影精品一区二区三区| 一级黄色片免费网站| 中文字幕二区在线观看| 日韩亚洲精品在线| 夜夜精品视频一区二区| 亚洲1区在线观看| 日韩一级在线视频| 亚洲国产精品一区二区久久hs| 欧美精品xxxxx| 制服丝袜亚洲一区| 欧美激情视频一区二区三区| 93久久精品日日躁夜夜躁欧美| 欧美日韩国产专区| 男女午夜爽爽| 午夜一区二区三区在线观看| 日韩欧美国产另类| 午夜精品一区二区三区三上悠亚| 亚洲1区2区3区4区| 一区二区国产盗摄色噜噜| 日本边做饭边被躁bd在线看 | 鲁丝一区二区三区免费| 国产剧情在线观看一区二区| 久久久久国产亚洲| 亚洲精品国产setv| 午夜影院一区二区| 午夜欧美a级理论片915影院 | 99日韩精品视频| 亚洲自拍偷拍中文字幕| 国产一区二三| 91午夜精品一区二区三区| 精品国产一区二区三| 亚洲国产欧洲综合997久久,| 午夜毛片在线观看| 久久中文一区二区| 91偷自产一区二区三区精品| 国产精品v欧美精品v日韩| 精品日韩久久久| 一区二区精品在线| 午夜无遮挡| 国产精品久久久不卡| 激情欧美一区二区三区| 国产一区日韩一区| 欧美高清性xxxx| 99三级视频| 国产精品一区二区麻豆| 午夜a电影| 狠狠色噜噜狠狠狠四色米奇| 日本美女视频一区二区三区| 国产日韩欧美三级| 亚洲欧美日韩另类精品一区二区三区| 国产精品美女一区二区视频| 一色桃子av大全在线播放| 午夜av资源| 久久久久久久亚洲国产精品87| 肉丝肉足丝袜一区二区三区| 欧美一区二区三区激情视频| 欧美国产一区二区三区激情无套| 91久久香蕉| 国产二区三区视频| 精品美女一区二区三区| 性欧美精品动漫| 国产麻豆精品久久| 99久久99精品| 国产一区在线精品| 免费a一毛片| 国产精品高潮呻吟88av| 男女视频一区二区三区| 欧美二区在线视频| 亚洲国产欧美一区二区三区丁香婷| 中文在线一区二区三区| 四虎国产精品永久在线国在线| 国产一区二区三区四区五区七| 91看黄网站| 欧美久久久一区二区三区| 福利片一区二区三区| 国产在线一卡| 国产91色综合| 91看片免费| 国产第一区在线观看| 日韩av在线影视| 亚洲乱小说| 激情久久久| 欧美国产一区二区在线| 日韩av免费网站| 欧美日韩中文国产一区发布| 欧美性受xxxx狂喷水| 亚洲国产精品入口| 久久午夜精品福利一区二区| 影音先锋久久久| a级片一区| 九九久久国产精品| 国产精品视频一区二区在线观看 | 高清欧美精品xxxxx| 午夜毛片电影| 91精品一区在线观看| 日韩av在线免费电影| 午夜码电影| 欧美日韩国产一二三| 日日夜夜精品免费看| 国产在线观看二区| 99日韩精品视频| 午夜免费av电影| 一区二区在线视频免费观看| 久久一区二区视频| 午夜亚洲国产理论片一二三四 | 女人被爽到高潮呻吟免费看| 国产呻吟高潮| 欧美黄色一二三区| 欧美国产精品久久| 国产69精品久久久久777糖心| 欧美精品一区二区三区视频| 在线国产精品一区| 婷婷嫩草国产精品一区二区三区| 91国偷自产一区二区介绍| 中文字幕一区二区三区乱码 | 日韩亚洲精品在线| 国内久久久| 日韩午夜三级| 视频一区欧美| 久久免费精品国产| 在线观看v国产乱人精品一区二区| 亚洲国产精品麻豆| 亚洲精品久久在线| 一色桃子av大全在线播放| 亚洲一卡二卡在线| 午夜私人影院在线观看| 十八无遮挡| 日本一区二区在线电影| 狠狠插狠狠插| 午夜wwwww| 国产69精品久久久久久| 99国产精品免费| 日韩免费一级视频| 日韩一区二区中文字幕| 日韩av不卡一区| 精品国产仑片一区二区三区| 亚洲国产精品一区在线| 亚洲精品无吗| 免费看性生活片| 欧美一区二区三区黄| 午夜爽爽爽男女免费观看| 欧美一区二区三区久久精品| 久久精品国产久精国产|