日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于動(dòng)態(tài)內(nèi)容解析的交互式信息采集方法及系統(tǒng)在審

專利信息
申請(qǐng)?zhí)枺?/td> 202011260845.6 申請(qǐng)日: 2020-11-12
公開(公告)號(hào): CN112364226A 公開(公告)日: 2021-02-12
發(fā)明(設(shè)計(jì))人: 楊忠軍;李建 申請(qǐng)(專利權(quán))人: 江蘇易啟策網(wǎng)絡(luò)科技有限公司
主分類號(hào): G06F16/951 分類號(hào): G06F16/951;G06F16/958
代理公司: 北京盛凡智榮知識(shí)產(chǎn)權(quán)代理有限公司 11616 代理人: 朱學(xué)繪
地址: 210000 江蘇省南京市秦淮區(qū)永豐大道*** 國省代碼: 江蘇;32
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 動(dòng)態(tài) 內(nèi)容 解析 交互式 信息 采集 方法 系統(tǒng)
【說明書】:

發(fā)明公開了一種基于動(dòng)態(tài)內(nèi)容解析的交互式信息采集方法,包括如下步驟:設(shè)定采集目標(biāo)網(wǎng)站和規(guī)則:用戶通過系統(tǒng)錄入需要采集的目標(biāo)網(wǎng)站,系統(tǒng)針對(duì)的是特定領(lǐng)域的信息采集,需要明確采集的范圍、起始條件、終止條件和采集間隔;動(dòng)態(tài)內(nèi)容解析采集和錄入:用戶通過動(dòng)態(tài)內(nèi)容解析采集插件對(duì)目標(biāo)網(wǎng)站的內(nèi)容進(jìn)行動(dòng)態(tài)解析。本發(fā)明增加了動(dòng)態(tài)內(nèi)容解析,可以更好的對(duì)爬取的內(nèi)容進(jìn)行結(jié)構(gòu)化,提高了數(shù)據(jù)的利用率,增加了交互式的數(shù)據(jù)采集方式,可以更好的應(yīng)對(duì)需要用戶授權(quán)的場景,提高了數(shù)據(jù)采集的范圍,優(yōu)化了數(shù)據(jù)采集的并發(fā)方式,可以更高效的完成高并發(fā)情況下的數(shù)據(jù)采集,提高了數(shù)據(jù)采集的效率。

技術(shù)領(lǐng)域

本發(fā)明涉及信息采集技術(shù)領(lǐng)域,尤其涉及一種基于動(dòng)態(tài)內(nèi)容解析的交互式信息采集方法及系統(tǒng)。

背景技術(shù)

網(wǎng)絡(luò)信息采集是一種用于采集互聯(lián)網(wǎng)的信息工具,目前的技術(shù)主要是采用靜態(tài)的、機(jī)械式的、無交互的信息采集方法,該方法只能用于公開的、簡單的、無反爬措施的信息的收集,因此收集到的信息普遍簡單化、價(jià)值低、無用率高,無法滿足特定場景下對(duì)于高價(jià)值數(shù)據(jù)的要求。

缺陷:(1)傳統(tǒng)架構(gòu)的信息采集只能做通用的文本爬取,無法動(dòng)態(tài)的針對(duì)內(nèi)容進(jìn)行解析;

(2)傳統(tǒng)架構(gòu)的信息采集只能做無交互式的文本爬取,無法應(yīng)對(duì)復(fù)雜的邏輯和環(huán)境;

(3)傳統(tǒng)架構(gòu)的信息采集的并發(fā)采用軟件模擬,性能有限,無法應(yīng)對(duì)超大數(shù)據(jù)量和極高并發(fā)的場景。

發(fā)明內(nèi)容

基于背景技術(shù)存在的技術(shù)問題,本發(fā)明提出了一種基于動(dòng)態(tài)內(nèi)容解析的交互式信息采集方法及系統(tǒng)。

本發(fā)明提出的一種基于動(dòng)態(tài)內(nèi)容解析的交互式信息采集方法,包括如下步驟:

S1設(shè)定采集目標(biāo)網(wǎng)站和規(guī)則:用戶通過系統(tǒng)錄入需要采集的目標(biāo)網(wǎng)站,系統(tǒng)針對(duì)的是特定領(lǐng)域的信息采集,需要明確采集的范圍、起始條件、終止條件和采集間隔;

S2動(dòng)態(tài)內(nèi)容解析采集和錄入:用戶通過動(dòng)態(tài)內(nèi)容解析采集插件對(duì)目標(biāo)網(wǎng)站的內(nèi)容進(jìn)行動(dòng)態(tài)解析,設(shè)定解析的字段和對(duì)應(yīng)的規(guī)則,通過字段和規(guī)則將原本非結(jié)構(gòu)化、純文本的網(wǎng)頁內(nèi)容轉(zhuǎn)換為結(jié)構(gòu)化的字段和內(nèi)容,完成對(duì)網(wǎng)頁的動(dòng)態(tài)解析;

S3啟動(dòng)分布式異步信息采集中心調(diào)度:完成上述準(zhǔn)備工作后,用戶在平臺(tái)上創(chuàng)建數(shù)據(jù)采集的任務(wù),并設(shè)定采集的具體參數(shù),設(shè)定完成之后,會(huì)由調(diào)度中心對(duì)任務(wù)進(jìn)行調(diào)度,調(diào)度過程完全自動(dòng)化、可視化;

S4采用多終端采集設(shè)備進(jìn)行特定信息的采集:調(diào)度中心會(huì)將具體的任務(wù)分配到不同的采集設(shè)備上進(jìn)行采集,采集設(shè)備會(huì)提供采集時(shí)必要的信息,包含位置、網(wǎng)絡(luò)、身份、MAC地址等一些信息,提供采集程序需要的基礎(chǔ)信息;

S5交互式信息接入和使用:如果采集任務(wù)過程中需要用到交互式的信息,平臺(tái)會(huì)將需要的認(rèn)證信息,通過SDK、H5或API的方式發(fā)送給用戶,并由用戶提交授權(quán)信息到平臺(tái)中心進(jìn)行認(rèn)證,平臺(tái)中心會(huì)根據(jù)不同任務(wù)的不同認(rèn)證方式從系統(tǒng)的任務(wù)鏈上選擇具體的模塊執(zhí)行;

S6內(nèi)容解析并存儲(chǔ):完成授權(quán)信息認(rèn)證之后,采集設(shè)備會(huì)使用動(dòng)態(tài)解析腳本針對(duì)動(dòng)態(tài)的網(wǎng)頁內(nèi)容進(jìn)行解析,并將解析內(nèi)容存儲(chǔ)推送到存儲(chǔ)中心。

一種基于動(dòng)態(tài)內(nèi)容解析的交互式信息采集系統(tǒng),包括目標(biāo)確定模塊、內(nèi)容解析模塊、任務(wù)調(diào)度模塊、信息采集模塊、信息交互模塊和解析存儲(chǔ)模塊,所述目標(biāo)確定模塊、內(nèi)容解析模塊、任務(wù)調(diào)度模塊、信息采集模塊、信息交互模塊和解析存儲(chǔ)模塊依次連接。

優(yōu)選的,所述目標(biāo)確定模塊:通過系統(tǒng)錄入需要采集的目標(biāo)網(wǎng)站,系統(tǒng)針對(duì)的是特定領(lǐng)域的信息采集,明確采集的范圍、起始條件、終止條件和采集間隔。

優(yōu)選的,所述內(nèi)容解析模塊:用戶通過動(dòng)態(tài)內(nèi)容解析采集插件對(duì)目標(biāo)網(wǎng)站的內(nèi)容進(jìn)行動(dòng)態(tài)解析,設(shè)定解析的字段和對(duì)應(yīng)的規(guī)則,通過字段和規(guī)則將原本非結(jié)構(gòu)化、純文本的網(wǎng)頁內(nèi)容轉(zhuǎn)換為結(jié)構(gòu)化的字段和內(nèi)容,完成對(duì)網(wǎng)頁的動(dòng)態(tài)解析。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇易啟策網(wǎng)絡(luò)科技有限公司,未經(jīng)江蘇易啟策網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011260845.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 精品一区二区三区影院| 亚洲神马久久| 中文乱幕日产无线码1区| 日韩一区免费在线观看| 亚洲国产欧洲综合997久久,| 日韩毛片一区| 午夜精品在线播放| 国产精品天堂网| 国产精品久久久久久久四虎电影| 中文字幕在线视频一区二区| 国产一区二| 欧美日韩国产123| 91av一区二区三区| 国产欧美一区二区三区沐欲| 满春阁精品av在线导航 | 亚洲欧美日韩在线看| 乱子伦农村| 久久99精品久久久大学生| 中文字幕一二三四五区| 午夜激情综合网| 亚洲国产精品肉丝袜久久| 国产精品久久免费视频| 狠狠色噜噜狠狠狠狠黑人| 国产亚洲精品久久久456| 性视频一区二区三区| 99国产精品久久久久老师| 国产日韩欧美网站| 国产videosfree性另类| 最新国产精品自拍| 久久精品综合| 日本精品三区| 国产欧美一区二区三区免费视频| 久久久精品欧美一区二区| 国产区一二| 国产欧美一区二区在线观看| 国产精品乱战久久久| 国产亚洲另类久久久精品| 久久综合国产精品| 91高跟紫色丝袜呻吟在线观看| 日韩欧美国产高清91| 午夜wwww| 国产欧美视频一区二区| 精品99免费视频| 国产综合久久精品| 一区精品二区国产| **毛片免费| 中文字幕另类日韩欧美亚洲嫩草| 欧美一级特黄乱妇高清视频| 91久久国产露脸精品国产| 国产精品久久久爽爽爽麻豆色哟哟 | 国产一区二区在线91| 香蕉免费一区二区三区在线观看| 最新国产精品自拍| 国产视频一区二区视频| 国产精一区二区三区| 中文字幕一区二区三区又粗| 国产精华一区二区精华| 午夜av免费看| 国产天堂一区二区三区| 精品久久久久一区二区| 91看片app| 国产精品中文字幕一区二区三区| 久久99精品久久久久婷婷暖91| 日韩午夜三级| 亚洲少妇一区二区三区| 国产精品一区一区三区| 亚洲va国产| 午夜看片网址| 国产日韩一区二区在线| 国内少妇自拍视频一区| 大桥未久黑人强制中出| 久久精品99国产精品亚洲最刺激| 国产女人与拘做受免费视频| 久久精品国产精品亚洲红杏| 欧美中文字幕一区二区三区| 99国产精品一区二区| 狠狠躁天天躁又黄又爽| 麻豆精品一区二区三区在线观看| 日韩精品福利片午夜免费观看| 自拍偷在线精品自拍偷无码专区| 538国产精品| 日韩精品乱码久久久久久| 亚洲欧美一区二区三区三高潮| 香港三日本三级三级三级| 高清欧美精品xxxxx| 日韩av在线资源| 日本一区二区三区四区高清视频| 玖玖爱国产精品| 欧美日韩中文不卡| 国产精品九九九九九九| 国产69精品久久久久9999不卡免费| 国产一区二区四区| 亚洲国产另类久久久精品性| 国产欧美三区| 欧美亚洲国产日韩| 日韩精品中文字幕在线播放| 免费久久一级欧美特大黄| 躁躁躁日日躁网站| 一区二区国产盗摄色噜噜| 国产一二区在线| 国产视频二区| 91亚洲精品国偷拍自产| 国产精品偷拍| 蜜臀久久久久久999| 国产乱人伦精品一区二区| 国产精品视频1区2区3区| 精品国精品国产自在久不卡| 欧美在线视频三区| 91精品婷婷国产综合久久竹菊| 精品国产品香蕉在线| 搡少妇在线视频中文字幕| 久久九精品| 精品福利一区| 国产一区二区高潮| 性色av色香蕉一区二区| 日本一区免费视频| 国产www亚洲а∨天堂| 国产日韩欧美在线影视| 右手影院av| 丝袜美腿诱惑一区二区| 久久不卡一区| 国产韩国精品一区二区三区| 亚洲欧美v国产一区二区| 国产亚洲精品久久久久秋霞 | 欧美高清性xxxx| 国产在线精品一区| 亚洲精品久久久久999中文字幕| 久久久久久亚洲精品| 综合久久激情| 亚洲国产精品一区二区久久hs| 久久青草欧美一区二区三区| 蜜臀久久99静品久久久久久| 欧美精品一区久久| 公乱妇hd在线播放bd| 国产一区在线免费| 一区二区中文字幕在线| 精品国产品香蕉在线| 日本精品99| 国产高清一区在线观看| 午夜av网址| 国产一区亚洲一区| 日本美女视频一区二区| 狠狠色噜噜狠狠狠狠2021免费| 精品一区电影国产| 国产精品久久国产精品99 | 一级久久久| 日韩久久影院| 国产色99| 精品国产乱码久久久久久虫虫| 欧美激情在线一区二区三区| 午夜毛片在线看| 三上悠亚亚洲精品一区二区| 欧美一级久久久| 国产精品三级久久久久久电影| 中文字幕一区二区三区乱码视频| 中文字幕一二三四五区| 欧美一区二区三区免费看| 天干天干天干夜夜爽av| 国产精品一区二区av日韩在线| 国产99久久久久久免费看| 国产一区二区二| 国产高清精品一区二区| 国产精品久久久久久久综合| 99国产精品| 久久国产欧美一区二区免费| 国产69精品久久久久男男系列| 亚洲激情中文字幕| 日韩欧美激情| 91高清一区| 欧美精品第一区| 国产一二区在线| 夜夜夜夜夜猛噜噜噜噜噜gg| 国产盗摄91精品一区二区三区| 欧美一区二区三区免费电影| 亚洲福利视频二区| 欧美色综合天天久久综合精品| 国产精品无码专区在线观看| 欧美一区二区三区四区夜夜大片 | 午夜影院啪啪| 日本中文字幕一区| 91偷自产一区二区三区精品| www.日本一区| 精品久久不卡| 久久精品亚洲一区二区三区画质| 免费久久一级欧美特大黄| 欧美极品少妇| 欧美激情综合在线| 国产欧美亚洲一区二区| 91在线一区| 国产一级自拍片| 日日夜夜一区二区| 日本少妇高潮xxxxⅹ| 国产精品天堂| 欧美综合在线一区| 久久精品亚洲一区二区三区画质| 91精品啪在线观看国产| 日韩精品免费一区二区中文字幕 | 国产69精品久久久久孕妇不能看| 欧美日韩久久一区二区| 99视频一区| 狠狠色噜噜狠狠狠狠米奇7777| 欧美亚洲精品suv一区| 午夜影院啊啊啊| 日本三级不卡视频| 国产日韩欧美一区二区在线观看| 国产欧美一区二区三区免费视频| 午夜亚洲国产理论片一二三四| 精品视频久| 精品一区中文字幕| 国产91久久久久久久免费| 99国产精品9| 日韩a一级欧美一级在线播放| 亚洲免费精品一区二区| 国产精品99在线播放| 久久福利视频网| 国产精品一区二区在线看| 欧美精选一区二区三区| 欧美乱妇高清无乱码免费| 夜色av网| 高清国产一区二区| 久久国产中文字幕| 国产亚洲综合一区二区| 中文字幕一区二区三区免费| 欧美日韩久久精品| 久久国产免费视频| 日韩精品一区二区三区免费观看视频| 久久99久久99精品免观看软件 | 91看黄网站| 最新国产一区二区| 国产免费一区二区三区四区五区| 亚洲国产99| 88888888国产一区二区| 日韩精品一区在线观看| 久久91精品国产91久久久 | 久久99精品一区二区三区| 国产高清在线一区| 国产日韩欧美亚洲| 国产精品一区二区日韩新区| 欧美一区二区三区白人| 亚洲精品乱码久久久久久写真| 亚洲国产一区二区久久久777| 久久精品99国产精品亚洲最刺激| 亚洲精品卡一| 国产欧美一区二区精品婷| 亚洲欧美国产日韩色伦| 国产亚洲精品精品国产亚洲综合 |