日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于云平臺的網(wǎng)站信息采集方法及系統(tǒng)有效

專利信息
申請?zhí)枺?/td> 202310076203.8 申請日: 2023-02-07
公開(公告)號: CN115982503B 公開(公告)日: 2023-10-13
發(fā)明(設(shè)計(jì))人: 梁禮津;柴玉軍;曹偉 申請(專利權(quán))人: 深圳慧梧科技有限公司
主分類號: G06F16/958 分類號: G06F16/958;G06F16/951;G06F16/953;G06F16/906
代理公司: 北京科創(chuàng)易佰知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 16113 代理人: 石文麗
地址: 518000 廣東省深圳市南山區(qū)粵*** 國省代碼: 廣東;44
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 平臺 網(wǎng)站 信息 采集 方法 系統(tǒng)
【說明書】:

發(fā)明公開了一種基于云平臺的網(wǎng)站信息采集方法,搭建信息采集系統(tǒng),所述信息系統(tǒng)包括信息采集服務(wù)器,以及多臺信息處理服務(wù)器,所述信息采集服務(wù)器在接收到信息采集的指令后,對所述指令進(jìn)行解析,得到待采集數(shù)據(jù)的對應(yīng)的標(biāo)簽和此次采集的數(shù)據(jù)的定制化級別;在得到到按照解析的指令得到的標(biāo)簽對應(yīng)的經(jīng)過初級存儲的信息數(shù)據(jù)后,所述數(shù)據(jù)處理策略進(jìn)一步包括數(shù)據(jù)拆分策略,即數(shù)據(jù)拆分后對應(yīng)發(fā)送的多臺信息處理服務(wù)器;所述多臺信息處理服務(wù)器執(zhí)行其自身對應(yīng)的數(shù)據(jù)處理功能,并將處理后的數(shù)據(jù)進(jìn)行保存于各自的數(shù)據(jù)庫中,用戶能夠選擇是否屏蔽數(shù)據(jù)存儲的一個或者多個信息處理服務(wù)器的數(shù)據(jù)處理功能,然后進(jìn)行顯示采集到的信息。

技術(shù)領(lǐng)域

本發(fā)明涉及計(jì)算機(jī)大數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種基于云平臺的網(wǎng)站信息采集方法及系統(tǒng)。

背景技術(shù)

定向采集系統(tǒng)是網(wǎng)絡(luò)蜘蛛的一種,它是網(wǎng)絡(luò)數(shù)據(jù)獲取系統(tǒng)的核心部分。它通過對互聯(lián)網(wǎng)上已知信息源(即網(wǎng)絡(luò)鏈接,URL:?Universal?Resource?Locator)的不斷抓取海量網(wǎng)頁內(nèi)容,獲取其中所有主題相關(guān)內(nèi)容。定向采集系統(tǒng)的優(yōu)劣集中體現(xiàn)在其抓取網(wǎng)頁內(nèi)容的速度、質(zhì)量以及抓取內(nèi)容和采集主題的匹配程度。目前,絕大多數(shù)的網(wǎng)絡(luò)蜘蛛都是單機(jī)版的,對于信息源和采集主題的管理相對比較簡單,通常是由管理員在服務(wù)器端進(jìn)行簡單配置,配置好后所有用戶均在此配置的制約下使用網(wǎng)絡(luò)蜘蛛。這樣,當(dāng)用戶需要有針對自己的需求進(jìn)行個性化配置時,就得不到滿足了。尤其當(dāng)這些個性化的需求日益增長時,目前的網(wǎng)絡(luò)蜘蛛就顯得捉襟見肘了。

同時,數(shù)據(jù)采集的信息處理由于數(shù)據(jù)量的問題導(dǎo)致后期處理較為困難,并且聚類的效果也不明顯,同時用戶采集的數(shù)據(jù)保存和信息安全都是需要額外注意的地方。

發(fā)明內(nèi)容

本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本發(fā)明公開了一種基于云平臺的網(wǎng)站信息采集方法,所述網(wǎng)站信息采集方法包括如下步驟:

步驟1,搭建信息采集系統(tǒng),所述信息系統(tǒng)包括信息采集服務(wù)器,以及多臺信息處理服務(wù)器,所述信息采集服務(wù)器在接收到信息采集的指令后,對所述指令進(jìn)行解析,得到待采集數(shù)據(jù)的對應(yīng)的標(biāo)簽和此次采集的數(shù)據(jù)的定制化級別;

步驟2,所述信息采集服務(wù)器獲取所述數(shù)據(jù)的定制化級別,并查詢所述定制化級別對應(yīng)的數(shù)據(jù)處理策略,所述數(shù)據(jù)處理策略首先對采集的數(shù)據(jù)按照標(biāo)簽類型進(jìn)行分別初級存儲,所述初級存儲為對采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗后存儲于所述信息采集服務(wù)器,按照所述標(biāo)簽分類檢查標(biāo)簽對應(yīng)的數(shù)據(jù)的一致性并處理采集數(shù)據(jù)的無效值和缺失值,其中,每個標(biāo)簽下的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗的方向不同,文字類型的數(shù)據(jù)需要檢測文字可讀性和完整性而數(shù)字類的數(shù)據(jù)需要進(jìn)行轉(zhuǎn)換將數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換為文字類型以減少數(shù)字類型數(shù)據(jù)缺失;

步驟3,在得到到按照解析的指令得到的標(biāo)簽對應(yīng)的經(jīng)過初級存儲的信息數(shù)據(jù)后,所述數(shù)據(jù)處理策略進(jìn)一步包括數(shù)據(jù)拆分策略,根據(jù)數(shù)據(jù)拆分策略對需要進(jìn)行拆分的標(biāo)簽下的數(shù)據(jù)進(jìn)行數(shù)據(jù)拆分,所述數(shù)據(jù)拆分策略包括數(shù)據(jù)拆分后的數(shù)據(jù)去處,即數(shù)據(jù)拆分后對應(yīng)發(fā)送的多臺信息處理服務(wù)器;

步驟4,所述多臺信息處理服務(wù)器執(zhí)行其自身對應(yīng)的數(shù)據(jù)處理功能,并將處理后的數(shù)據(jù)進(jìn)行保存于各自的數(shù)據(jù)庫中,所述數(shù)據(jù)庫構(gòu)建數(shù)據(jù)索引表并發(fā)送回所述信息采集服務(wù)器,所述信息采集服務(wù)器再發(fā)送預(yù)設(shè)格式的采集數(shù)據(jù)對應(yīng)的數(shù)據(jù)索引集合;

步驟5,用戶的客戶端在接收到預(yù)設(shè)格式數(shù)據(jù)索引集合后,能夠選擇是否屏蔽數(shù)據(jù)存儲的一個或者多個信息處理服務(wù)器的數(shù)據(jù)處理功能,然后進(jìn)行顯示采集到的信息,即用戶直接按照數(shù)據(jù)索引集合顯示處理后的數(shù)據(jù)內(nèi)容或者屏蔽部分的信息處理服務(wù)器的數(shù)據(jù)處理按照數(shù)據(jù)索引集合顯示在部分處理后的數(shù)據(jù)和部分未處理的數(shù)據(jù)。

更進(jìn)一步地,所述數(shù)據(jù)拆分策略,首先根據(jù)最小拆分單元對標(biāo)簽對應(yīng)的初級存儲的數(shù)據(jù)進(jìn)行編號,每個編號對應(yīng)于一個最小拆分單元,根據(jù)標(biāo)簽對應(yīng)的預(yù)設(shè)關(guān)鍵詞進(jìn)行關(guān)鍵詞的定位,在定位到關(guān)鍵詞所在的數(shù)據(jù)信息的位置之后,再以所述數(shù)據(jù)拆分策略規(guī)定的最小拆分單元拆分出關(guān)鍵詞對應(yīng)的編號區(qū)域。

更進(jìn)一步地,所述最小拆分單元為詞、句或者段落中的一種或多種的組合。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳慧梧科技有限公司,未經(jīng)深圳慧梧科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310076203.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产午夜精品一区理论片飘花 | 国产91高清| 狠狠躁日日躁狂躁夜夜躁av| 日本一区二区三区免费视频| 午夜影院一区二区| 婷婷午夜影院| 91久久国语露脸精品国产高跟 | 亚洲精品中文字幕乱码三区91| sb少妇高潮二区久久久久| 欧美日韩卡一卡二| 午夜一级免费电影| 国产精品视频1区2区3区| 日韩精品一区二区三区在线| 亚洲国产精品91| 男女无遮挡xx00动态图120秒| 欧美在线免费观看一区| 欧美在线一区二区视频| 国内精品久久久久久久星辰影视| 欧美系列一区二区| 国产.高清,露脸,对白| 国产人澡人澡澡澡人碰视| 久久黄色精品视频| 99精品欧美一区二区| 国产日韩欧美自拍| 99日本精品| 狠狠色丁香久久婷婷综合丁香| 性色av色香蕉一区二区| 久精品国产| 99久久精品一区二区| 国产伦精品一区二区三区免费迷| 国产精品一区在线观看你懂的| 精品香蕉一区二区三区| 精品久久久久99| 国产精品影音先锋| 日本一区二区在线电影| 国产一二三区免费| 国产精品久久久久四虎| 国产精品久久久久久久久久久久久久不卡 | 免费看欧美中韩毛片影院| 中文乱幕日产无线码1区| 国产精品一二三区视频出来一| 国产aⅴ一区二区| 久久国产精彩视频| 国产视频在线一区二区| 欧美精品在线不卡| 综合色婷婷一区二区亚洲欧美国产 | 日韩午夜毛片| 精品久久久久一区二区| 夜夜嗨av禁果av粉嫩av懂色av | 久久天堂国产香蕉三区| 日韩av在线高清| 国产999久久久| 国产一级片一区二区| 99色精品视频| 国产一区二区三区小说| 日韩无遮挡免费视频| 国产精品第157页| 国产美女一区二区三区在线观看| 国产精品久久久久久久综合| 99精品国产一区二区三区不卡 | 野花社区不卡一卡二| 久久精品国产色蜜蜜麻豆| 国产精品二区一区| 国产精品久久国产三级国电话系列| 久久不卡一区| 国产另类一区| 激情久久久| 国产极品美女高潮无套久久久| 精品国产亚洲一区二区三区| 日本精品一二区| 国产精品久久免费视频| 亚洲欧美国产精品一区二区| 日韩av一区二区在线播放| 欧美国产亚洲精品| 欧美一区二区三区免费观看视频| 亚洲国产精品入口| 久久激情图片| 97人人揉人人捏人人添| 日韩中文字幕在线一区二区| 久草精品一区| 欧美在线观看视频一区二区| 亚洲乱小说| 精品美女一区二区三区| 国产精品电影免费观看| 国产精品19乱码一区二区三区| 亚洲精品国产精品国自| 国产区91| 国产视频二区| 久久午夜精品福利一区二区| 国产1区2区3区| 欧美一区亚洲一区| 久久精品一| 91久久精品国产亚洲a∨麻豆| 99久久精品免费视频| 欧美日韩中文国产一区发布| 综合在线一区| 国产欧美一区二区三区沐欲| 精品少妇一区二区三区 | 亚洲欧美国产一区二区三区 | 中文字幕日本一区二区| 国产乱对白刺激在线视频| 中文乱码字幕永久永久电影| 午夜激情看片| 午夜国内精品a一区二区桃色| 国产一区二区在线91| 日本看片一区二区三区高清| 性old老妇做受| 国产精品久久亚洲7777| 日韩精品免费一区二区中文字幕 | 456亚洲精品| 国产精品偷拍| 日韩精品一区二区三区免费观看| 国产精品18久久久久白浆| 国产一区二区黄| 农村妇女精品一二区| 色婷婷精品久久二区二区我来| 国产真实一区二区三区| 国精偷拍一区二区三区| 国产精品无码专区在线观看| 欧美日韩久久一区二区| 亚洲精品久久久久www| 国产精品日产欧美久久久久| 日韩精品福利片午夜免费观看| 99国产超薄丝袜足j在线观看| 国产在线拍揄自揄拍| 国产一卡二卡在线播放| 久久影视一区二区| 午夜社区在线观看| 97久久精品人人做人人爽| 国产乱人伦精品一区二区三区| 久久精品国产亚| 久久国产精品波多野结衣| 99久久国产综合精品女不卡| 激情久久久| 国产精品久久久不卡| 亚洲欧美国产日韩综合| 国产精品久久久久久久久久久新郎| 国产一区二区精品免费| 69久久夜色精品国产7777| 亚洲国产美女精品久久久久∴| 国产又黄又硬又湿又黄| 国产精品日韩三级| 久久密av| 国产精品6699| 日本一二三区视频| 久久精品亚洲精品国产欧美| 国产一区二区91| 狠狠色综合久久婷婷色天使| 日韩一区二区三区福利视频| 久久99精品国产麻豆宅宅| 国产精品三级久久久久久电影| 热99re久久免费视精品频软件 | 国产区图片区一区二区三区| 精品三级一区二区| 国产日韩精品一区二区| 99精品国产99久久久久久97 | 亚洲码在线| 欧美日韩激情一区二区| 手机看片国产一区| 亚洲欧美日本一区二区三区| 国产视频在线一区二区| 国产乱老一区视频| 在线视频不卡一区| 国产欧美精品一区二区三区小说 | 91精品视频一区二区三区 | 欧美精品在线一区二区| 久久噜噜少妇网站| 国产www亚洲а∨天堂| 久久99精品久久久噜噜最新章节| 久久一二区| 午夜亚洲国产理论片一二三四| 一区二区久久精品66国产精品| 国产电影精品一区| 国产精品久久久综合久尹人久久9| 日韩一级视频在线| 日韩一级片在线免费观看| 国产99视频精品免视看芒果| 欧美黑人巨大久久久精品一区| 亚洲欧美一卡二卡| 四虎久久精品国产亚洲av| 国产精品久久久综合久尹人久久9| 亚洲精品国产主播一区| 午夜av男人的天堂| 国产精品一区久久人人爽| 日本高清不卡二区| 欧美三级午夜理伦三级中视频| 国模吧一区二区| 日韩av一区二区在线播放| 国产精品一区二区人人爽| 夜夜嗨av禁果av粉嫩av懂色av| 亚洲精品国产精品国自| 一本色道久久综合亚洲精品浪潮| 99re6国产露脸精品视频网站| 国产欧美日韩精品一区二区三区 | 玖玖精品国产| 日韩精品一二区| 激情久久久久久| 欧美精品日韩精品| 国产在线一二区| 国产69精品久久久久app下载| 国产精品久久免费视频在线| 国产69久久| 国产亚洲欧美日韩电影网| 91久久精品久久国产性色也91| 国产床戏无遮挡免费观看网站| 国产精品一区二区麻豆| 91麻豆国产自产在线观看hd| 久久99精品国产99久久6男男| 女女百合互慰av| 午夜少妇性影院免费观看| 国产性猛交96| 国产一区在线免费| 精品综合久久久久| 日本道欧美一区二区aaaa| 岛国精品一区二区| 亚洲国产欧美一区二区三区丁香婷 | 欧美三级午夜理伦三级老人| 国产精品视频二区不卡| 国产精品一区二| 日韩久久精品一区二区三区| 国产午夜精品一区二区理论影院| 免费看大黄毛片全集免费| 国产色一区二区| 国产大学生呻吟对白精彩在线| 精品国产一区二区三区四区四| 国产精品v欧美精品v日韩精品v | 亚洲久久在线| 国产黄色一区二区三区| 国产在线一二区| 中文在线一区二区三区| 久久精品国产一区二区三区不卡| 欧美日韩一区二区三区免费| 亚洲乱码一区二区三区三上悠亚| 欧美69精品久久久久久不卡| 欧美精品一卡二卡| 午夜一区二区三区在线观看| 国产精品综合一区二区| 午夜电影一区| 久久第一区| 国产91热爆ts人妖在线| 二区三区视频| 国产综合亚洲精品| 久久99精品国产99久久6男男 | 免费的午夜毛片| 91精品国产高清一二三四区| 欧美一级久久精品|