日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]快速驗(yàn)證CSS選擇器的方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 201710734682.2 申請(qǐng)日: 2017-08-24
公開(公告)號(hào): CN107463713A 公開(公告)日: 2017-12-12
發(fā)明(設(shè)計(jì))人: 張超 申請(qǐng)(專利權(quán))人: 四川長(zhǎng)虹電器股份有限公司
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 成都虹橋?qū)@聞?wù)所(普通合伙)51124 代理人: 李凌峰
地址: 621000 四*** 國(guó)省代碼: 四川;51
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 快速 驗(yàn)證 css 選擇器 方法
【說明書】:

技術(shù)領(lǐng)域

本發(fā)明涉及利用Java下載網(wǎng)頁源碼技術(shù),特別涉及CSS選擇器技術(shù)。

背景技術(shù)

網(wǎng)絡(luò)爬蟲是按照一定規(guī)則自動(dòng)抓取WEB信息的程序或腳本,也被稱為網(wǎng)絡(luò)追逐者。在網(wǎng)絡(luò)迅速發(fā)展的今天,萬維網(wǎng)成為最大的信息載體,傳統(tǒng)的搜索引擎作為輔助人們檢索信息的工具也存在著一定的局限性:1.不同的用戶往往有不同的檢索目的,而搜索引擎會(huì)返回大量的無用信息,導(dǎo)致資源的浪費(fèi);2.搜索引擎的目標(biāo)是盡可能大的網(wǎng)絡(luò)資源覆蓋,而隨著網(wǎng)絡(luò)資源的日益豐富,搜索引擎有限的資源越來越不能滿足需要;3.搜索引擎對(duì)種類越來越多的網(wǎng)絡(luò)資源越來越無能為力,具有一定結(jié)構(gòu)的圖片、數(shù)據(jù)庫、音頻、視頻等密集資源是搜索引擎所不能解決的;4.搜索引擎都是通過關(guān)鍵字進(jìn)行索引,很難通過語義進(jìn)行分析檢索。為了解決上述問題定向抓取網(wǎng)絡(luò)資源的聚焦網(wǎng)絡(luò)爬蟲應(yīng)運(yùn)而生,聚焦網(wǎng)絡(luò)爬蟲根據(jù)目標(biāo)信息,定向訪問網(wǎng)絡(luò)資源,從而快速獲得想要的信息。

目前,如何高效快速的編寫網(wǎng)絡(luò)爬蟲成為熱點(diǎn),在編寫聚焦網(wǎng)絡(luò)爬蟲時(shí),快速準(zhǔn)確的獲得CSS(層疊樣式表)選擇器成為信息抓取的關(guān)鍵。CSS,即層疊樣式表,通常定義如何顯示HTML元素,通過CSS文檔可以改變頁面中的布局和外觀,而CSS選擇器則可以選擇出你所需要的樣式的HTML元素,因此,快速準(zhǔn)確的獲取CSS選擇器成為信息抓取的關(guān)鍵。目標(biāo)網(wǎng)站中通常通過動(dòng)態(tài)加載HTML信息進(jìn)行反爬取,因此很難快速獲取到有效的CSS選擇器,本專利提出了一個(gè)快速驗(yàn)證CSS選擇器的方法,通過界面化工具快速驗(yàn)證CSS選擇器是否能夠抓取HTML信息,當(dāng)出現(xiàn)CSS選擇器無效時(shí),使用調(diào)用瀏覽器內(nèi)核的方式下載網(wǎng)頁源碼,根據(jù)下載的網(wǎng)絡(luò)源碼,重新編寫CSS選擇器表達(dá)式,解決網(wǎng)頁動(dòng)態(tài)加載造成的信息爬取失敗問題。

Httpclient可以更好地處理向Web站點(diǎn)請(qǐng)求,它是一個(gè)簡(jiǎn)單的HTTP客戶端,可以用于發(fā)送HTTP請(qǐng)求,接收HTTP響應(yīng),但不會(huì)緩存服務(wù)器的響應(yīng),不能執(zhí)行HTML頁面中嵌入的JavaScript代碼,也不會(huì)對(duì)頁面內(nèi)容進(jìn)行任何解析及處理。

發(fā)明內(nèi)容

本發(fā)明的目的是提供一種快速驗(yàn)證CSS選擇器的方法,解決在編寫聚焦網(wǎng)絡(luò)爬蟲時(shí),目標(biāo)網(wǎng)站中通常通過動(dòng)態(tài)加載信息進(jìn)行反爬,很難快速有效的獲取CSS選擇器的問題。

本發(fā)明解決其技術(shù)問題,采用的技術(shù)方案是:快速驗(yàn)證CSS選擇器的方法,其特征在于,包括以下步驟:

步驟1、從所需網(wǎng)頁獲取目標(biāo)網(wǎng)址和CSS選擇器并輸入目標(biāo)網(wǎng)址;

步驟2、通過HttpClient下載目標(biāo)網(wǎng)頁的網(wǎng)頁源碼并解析;

步驟3、輸入CSS選擇器并對(duì)解析出的信息進(jìn)行抓取;

步驟4、判斷抓取的信息是否滿足需要,若滿足,則結(jié)束,若不滿足,則進(jìn)入步驟5;

步驟5、判斷抓取的信息是否為動(dòng)態(tài)加載信息,若是,則進(jìn)入步驟6,若不是,則進(jìn)入步驟3;

步驟6、調(diào)用瀏覽器內(nèi)核重新下載目標(biāo)網(wǎng)頁的網(wǎng)頁源碼并解析;

步驟7、重新編寫CSS選擇器,并輸入;

步驟8、利用重新編寫的CSS選擇器對(duì)解析出的信息進(jìn)行抓取;

步驟9、判斷抓取的信息是否滿足需要,若滿足,則結(jié)束,若不滿足,則進(jìn)入步驟8。

具體的,步驟1中,所述從所需網(wǎng)頁獲取目標(biāo)網(wǎng)址使用的是GetText()函數(shù)。

進(jìn)一步的,步驟2中,所述通過HttpClient下載目標(biāo)網(wǎng)頁的網(wǎng)頁源碼具體包括以下步驟:

步驟201、設(shè)定HttpCliet網(wǎng)絡(luò)連接參數(shù);

步驟202、建立Http網(wǎng)絡(luò)連接;

步驟203、使用HttpClient的Get方法獲得目標(biāo)網(wǎng)頁的網(wǎng)頁源碼。

具體的,步驟201中,HttpCliet網(wǎng)絡(luò)連接參數(shù)的設(shè)定具體包括:

a、請(qǐng)求超時(shí)時(shí)間,默認(rèn)設(shè)置為2秒;

b、等待數(shù)據(jù)超時(shí)時(shí)間,默認(rèn)設(shè)置為2秒;

c、連接不夠用等待超時(shí)時(shí)間,默認(rèn)設(shè)置為500毫秒;

d、整個(gè)連接池最大連接數(shù),默認(rèn)設(shè)置為200。

再進(jìn)一步的,步驟2及步驟6中,對(duì)目標(biāo)網(wǎng)頁的網(wǎng)頁源碼的解析使用了Jsoup解析器。

具體的,步驟6中,使用Selenium Webdriver調(diào)用瀏覽器內(nèi)核。

再進(jìn)一步的,步驟6中,所述瀏覽器為型號(hào)為Chrome的瀏覽器。

本發(fā)明的有益效果是,通過上快速驗(yàn)證CSS選擇器的方法,當(dāng)判斷由于網(wǎng)頁動(dòng)態(tài)信息導(dǎo)致CSS選擇器不可用時(shí),調(diào)用瀏覽器內(nèi)核重新下載目標(biāo)網(wǎng)頁的網(wǎng)頁源碼并解析,然后重新編寫CSS選擇器,從而快速獲得有效的CSS選擇器。

具體實(shí)施方式

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川長(zhǎng)虹電器股份有限公司,未經(jīng)四川長(zhǎng)虹電器股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710734682.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产乱码一区二区| 久久精品综合| 91丝袜国产在线播放| 日韩精品一区二区三区不卡| 国产日韩欧美亚洲综合| 亚洲精品国产setv| 日韩精品免费一区二区在线观看| 精品videossexfreeohdbbw| 国产精品视频久久久久| 久久午夜鲁丝片午夜精品| 91精品久久久久久综合五月天 | 男女午夜影院| 大桥未久黑人强制中出| 91久久久爱一区二区三区| 麻豆精品国产入口| 97欧美精品| 国产精品亚发布| 曰韩av在线| 国产一区2| 国产精品免费一视频区二区三区| 久久久久国产一区二区三区不卡| 在线播放国产一区| 亚洲午夜精品一区二区三区| 亚洲乱视频| 日韩精品免费一区二区中文字幕| 久久综合狠狠狠色97| 欧美精品xxxxx| 四虎久久精品国产亚洲av| 国产精品电影一区二区三区| 欧美二区精品| 国产一区二区日韩| 久久久久国产精品一区二区三区| 一区精品二区国产| 91人人爽人人爽人人精88v| 欧美一区二区三区在线视频观看| 国产91在| 国产性生交xxxxx免费| 国产一区影院| 亚洲欧美另类综合| 久久精品视频3| 午夜国产一区二区三区四区| 日韩精品一区二区三区免费观看| 午夜大片男女免费观看爽爽爽尤物| 国产高潮国产高潮久久久91| 性国产日韩欧美一区二区在线| 日韩av在线播| 欧洲激情一区二区| 国产激情二区| 久久伊人色综合| 午夜精品在线观看| 亚洲精品日日夜夜| 国产午夜精品理论片| 亚洲欧美一区二| 色综合久久精品| 麻豆91在线| 国产男女乱淫真高清视频免费| 国产日韩区| 国产性生交xxxxx免费| 福利电影一区二区三区| 国产88在线观看入口| 国产欧美一区二区三区免费视频| 午夜精品一二三区| 天堂av一区二区| 黄色91在线观看| 欧美日韩国产精品一区二区三区| 色乱码一区二区三区网站| 国产精品二区一区二区aⅴ| 综合国产一区| 欧美一区二区三区国产精品| 国产精品亚洲第一区| 精品国产1区2区3区| 欧美日韩卡一卡二| 免费看欧美中韩毛片影院| 狠狠操很很干| 色综合欧美亚洲国产| 国产午夜精品一区| 国产理论一区| 99久久免费毛片基地| 久久99精品国产| 午夜亚洲影院| 强制中出し~大桥未久10在线播放| 国产免费一区二区三区四区| 99久久久国产精品免费无卡顿| 国产不卡一区在线| 精品国产一区二| 亚洲欧美一卡| 欧美精品乱码视频一二专区| 精品美女一区二区三区| 欧美福利三区| 久久综合伊人77777麻豆最新章节| 97视频精品一二区ai换脸| 亚洲国产精品一区在线| 91精品久久久久久综合五月天| 国产馆一区二区| 欧美在线观看视频一区二区| 波多野结衣女教师电影| 国产一区在线免费| 日韩精品一区二区三区不卡| 国产一级二级在线| 国产精品国产三级国产播12软件| 国产在线不卡一| 午夜老司机电影| 欧洲另类类一二三四区| 在线国产91| 精品久久久久久亚洲综合网 | 伊人欧美一区| 国产69精品久久久久孕妇不能看| 国产欧美精品一区二区三区小说 | 国产精品欧美久久久久一区二区| 国产日韩区| 亚洲欧美日韩一级| 国产精品综合在线| 欧美一区二区三区白人| 国产精品电影免费观看| 狠狠色丁香久久婷婷综合_中| 国产一级大片| 国产天堂第一区| 日韩欧美国产第一页| 日本一二三区视频在线| 亚洲欧美日韩精品suv| 精品国产一区二区三区高潮视| 国产视频一区二区在线播放| 欧美精品国产精品| 玖玖国产精品视频| 日韩av在线播放网址| 国产在线欧美在线| 夜夜躁日日躁狠狠躁| 国产精品麻豆99久久久久久| 97人人模人人爽人人喊0| 久久久精品欧美一区二区| 精品99免费视频| 国产麻豆精品一区二区| 李采潭无删减版大尺度| 国产精品美女久久久免费| 亚洲乱玛2021| 狠狠色狠狠色综合系列| 国产日韩欧美不卡| 亚洲精品久久久久久久久久久久久久 | 91精品啪在线观看国产手机| 国产欧美一区二区在线观看| 亚洲三区二区一区| 午夜裸体性播放免费观看| 欧美一区二区精品久久911| 国产一区在线视频播放| 国产一区二区四区| 国产伦精品一区二区三区免| 国产真实乱偷精品视频免| 三级午夜片| 福利视频亚洲一区| 91久久综合亚洲鲁鲁五月天| 国产一区二区精品免费 | 久久精品综合视频| 色综合久久久| 91精品国产综合久久国产大片 | 日本精品在线一区| 久久国产精品免费视频| aaaaa国产欧美一区二区 | 亚洲午夜国产一区99re久久| 国产jizz18女人高潮| 亚洲天堂国产精品| 性生交大片免费看潘金莲| 免费视频拗女稀缺一区二区| 欧美高清性xxxx| 国产日产精品一区二区| 夜夜躁日日躁狠狠久久av| 国产真实一区二区三区| 性色av色香蕉一区二区三区| 欧美日韩中文不卡| 亚洲高清乱码午夜电影网| 国产精彩视频一区二区| 四虎国产永久在线精品| 亚洲欧美日韩在线看| 国产盗摄91精品一区二区三区| 91精品综合| 中文字幕欧美久久日高清| 超碰97国产精品人人cao| 99国产精品| 国产精品二区一区二区aⅴ| 欧美一区二区久久久| 激情久久综合| 久久精品国产亚洲7777| 国产91丝袜在线播放动漫| 最新国产一区二区| 国产一卡在线| 中文字幕欧美一区二区三区| 国产精选一区二区| 国产91一区| 国内视频一区二区三区| 日日噜噜夜夜狠狠| 亚洲精品久久久中文| 狠狠色狠狠色综合日日2019| 色一情一乱一乱一区99av白浆| 在线观看v国产乱人精品一区二区| 一二三区欧美| 久久久久久亚洲精品| 欧美精品国产一区| 亚洲精品日本久久一区二区三区 | 日韩av不卡一区二区| 久久亚洲综合国产精品99麻豆的功能介绍| 国产精品久久国产三级国电话系列| 国产精品一区二区中文字幕| 狠狠色噜噜狠狠狠狠2018| 亚洲欧美日韩精品suv| 国产高清在线精品一区二区三区| 日本黄页在线观看| 午夜特片网| 三级视频一区| 麻豆国产一区二区三区| 国产大学生呻吟对白精彩在线| 国产91麻豆视频| 国产精品视频久久久久久| 午夜精品一二三区| 亚洲高清毛片一区二区| 久久婷婷国产香蕉| 欧美在线一区二区视频| 99久久免费精品国产男女性高好| 国产精选一区二区| 国产欧美一区二区三区精品观看| 欧洲精品一区二区三区久久| 免费精品一区二区三区第35| 久久国产精品-国产精品| 中文字幕久久精品一区| 午夜精品999| 日本不卡精品| 搡少妇在线视频中文字幕| 国产精品69久久久| 午夜激情免费电影| 国产一区二区三区四| 91精品国产九九九久久久亚洲| 99久久免费毛片基地| 影音先锋久久久| 日韩av在线资源| 久久精品国产久精国产| 亚洲色欲色欲www| 久久精品综合视频| 国产一区网址| 色狠狠色狠狠综合| 国产一区二区播放| 十八无遮挡| 2023国产精品久久久精品双| 亚洲国产精品一区二区久久,亚洲午夜| 欧美日韩国产精品一区二区三区| 狠狠色噜噜狠狠狠四色米奇| 国产一区二区三区黄| 激情久久一区二区三区| 亚洲四区在线观看|