[發(fā)明專利]一種基于網(wǎng)絡(luò)爬蟲(chóng)的網(wǎng)站指紋信息掃描的方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201811325785.4 | 申請(qǐng)日: | 2018-11-08 |
| 公開(kāi)(公告)號(hào): | CN109376291B | 公開(kāi)(公告)日: | 2020-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 趙海博;范淵;莫金友 | 申請(qǐng)(專利權(quán))人: | 杭州安恒信息技術(shù)股份有限公司 |
| 主分類號(hào): | G06F16/951 | 分類號(hào): | G06F16/951;G06F16/953 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 310000 浙江省杭州*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 網(wǎng)絡(luò) 爬蟲(chóng) 網(wǎng)站 指紋 信息 掃描 方法 裝置 | ||
本發(fā)明公開(kāi)了一種基于網(wǎng)絡(luò)爬蟲(chóng)的網(wǎng)站指紋信息掃描方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該方法包括:獲取構(gòu)建網(wǎng)站所需的多個(gè)元素類,記錄各個(gè)元素類下各個(gè)元素具有的與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值,且記錄的不同元素對(duì)應(yīng)同一預(yù)設(shè)特征元素的特征值不同,預(yù)設(shè)特征元素包括響應(yīng)頭特征、引入js特征、script特征、html特征及所屬元素類;利用網(wǎng)絡(luò)爬蟲(chóng)爬取目標(biāo)網(wǎng)站的內(nèi)容,得到目標(biāo)網(wǎng)站與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值,將得到的特征值與記錄的特征值進(jìn)行比對(duì),得到包含有與目標(biāo)網(wǎng)站的特征值匹配的記錄的特征值的網(wǎng)站指紋信息。從而實(shí)現(xiàn)指紋獲取的較高準(zhǔn)確性及實(shí)現(xiàn)效率。
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)安全技術(shù)領(lǐng)域,更具體地說(shuō),涉及一種基于網(wǎng)絡(luò)爬蟲(chóng)的網(wǎng)站指紋信息掃描的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
為網(wǎng)站生成對(duì)應(yīng)的識(shí)別度較高的網(wǎng)站指紋,對(duì)于網(wǎng)絡(luò)安全具有重大意義。現(xiàn)有技術(shù)中用于實(shí)現(xiàn)網(wǎng)站指紋生成的技術(shù)方案為依據(jù)預(yù)先設(shè)置的組件模板庫(kù)中存儲(chǔ)的網(wǎng)站服務(wù)器模板,構(gòu)建對(duì)應(yīng)的組件虛擬網(wǎng)站;按照預(yù)先設(shè)置的策略訪問(wèn)所述組件虛擬網(wǎng)站中用于組件版本升級(jí)的鏈接地址,如果所述鏈接地址對(duì)應(yīng)的組件服務(wù)器中有新的組件版本,升級(jí)所述組件虛擬網(wǎng)站中的組件;訪問(wèn)升級(jí)后的所述組件虛擬網(wǎng)站,從返回的訪問(wèn)請(qǐng)求響應(yīng)中提取特征信息;查詢并獲取預(yù)先存儲(chǔ)的所述組件虛擬網(wǎng)站的當(dāng)前組件版本指紋,得到所述當(dāng)前組件版本指紋對(duì)應(yīng)的歷史特征信息,依據(jù)提取的特征信息以及所述歷史特征信息生成所述組件虛擬網(wǎng)站的組件版本升級(jí)指紋。
現(xiàn)有技術(shù)需要根據(jù)組件模板庫(kù)構(gòu)造新的虛擬網(wǎng)站,然后提取特征信息,對(duì)目標(biāo)網(wǎng)站是一個(gè)模仿而非真實(shí)復(fù)制,現(xiàn)階段通常目標(biāo)網(wǎng)站內(nèi)容是經(jīng)常發(fā)生變化的,如果構(gòu)造的虛擬網(wǎng)站不能完全反應(yīng)原目標(biāo)網(wǎng)站的特征,則會(huì)造成網(wǎng)站指紋的不準(zhǔn)確甚至誤報(bào),且本身該過(guò)程是一個(gè)較耗時(shí)的多步操作,使用效率不高。
綜上所述,現(xiàn)有技術(shù)中用于實(shí)現(xiàn)網(wǎng)站指紋獲取的方案存在準(zhǔn)確性較低且使用效率較低的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于網(wǎng)絡(luò)爬蟲(chóng)的網(wǎng)站指紋信息掃描的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能夠解決現(xiàn)有技術(shù)中用于實(shí)現(xiàn)網(wǎng)站指紋獲取的方案存在的準(zhǔn)確性較低且使用效率較低的問(wèn)題。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于網(wǎng)絡(luò)爬蟲(chóng)的網(wǎng)站指紋信息掃描方法,包括:
獲取構(gòu)建網(wǎng)站所需的多個(gè)元素類,所述元素類包括操作系統(tǒng)、編程語(yǔ)言、網(wǎng)頁(yè)服務(wù)器、網(wǎng)頁(yè)應(yīng)用框架、腳本語(yǔ)言框架及內(nèi)容管理系統(tǒng);
記錄各個(gè)元素類下各個(gè)元素具有的與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值,且記錄的不同元素對(duì)應(yīng)同一預(yù)設(shè)特征元素的特征值不同,所述預(yù)設(shè)特征元素包括響應(yīng)頭特征、引入js特征、script特征、html特征及所屬元素類;
利用網(wǎng)絡(luò)爬蟲(chóng)爬取目標(biāo)網(wǎng)站的內(nèi)容,得到所述目標(biāo)網(wǎng)站與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值,將得到的特征值與記錄的特征值進(jìn)行比對(duì),得到包含有與所述目標(biāo)網(wǎng)站的特征值匹配的記錄的特征值的網(wǎng)站指紋信息。
優(yōu)選的,記錄各個(gè)元素類下各個(gè)元素具有的與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值,包括:
如果各個(gè)元素類下各個(gè)元素具有的任一特征值引用預(yù)設(shè)基礎(chǔ)特征,則記錄該任一特征值時(shí)同時(shí)記錄引用的預(yù)設(shè)基礎(chǔ)特征的名稱。
優(yōu)選的,記錄各個(gè)元素類下各個(gè)元素具有的與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值之后,還包括:
將記錄的特征值構(gòu)造成格式相同的json字符。
優(yōu)選的,記錄各個(gè)元素類下各個(gè)元素具有的與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值,包括:
在預(yù)先設(shè)定的特征模板庫(kù)中記錄各個(gè)元素類下各個(gè)元素具有的與任一或任多預(yù)設(shè)特征元素對(duì)應(yīng)的特征值。
優(yōu)選的,得到網(wǎng)站指紋信息之后,還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州安恒信息技術(shù)股份有限公司,未經(jīng)杭州安恒信息技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811325785.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 檢測(cè)反爬蟲(chóng)策略安全性的方法及裝置
- 一種監(jiān)控網(wǎng)絡(luò)爬蟲(chóng)的方法、裝置和系統(tǒng)
- 一種通過(guò)爬蟲(chóng)狀態(tài)機(jī)管理爬蟲(chóng)的方法及裝置
- 爬蟲(chóng)協(xié)議管理方法及裝置、爬蟲(chóng)系統(tǒng)
- 基于APP客戶端的爬蟲(chóng)及爬取方法
- 視頻業(yè)務(wù)處理方法、裝置及電子設(shè)備
- 一種爬蟲(chóng)方法、裝置、系統(tǒng)、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 分布式爬蟲(chóng)系統(tǒng)架構(gòu)、爬取數(shù)據(jù)的方法和計(jì)算機(jī)設(shè)備
- 基于scrapy爬蟲(chóng)框架的數(shù)據(jù)采集系統(tǒng)及方法
- 多中心綜合網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng)
- 與HTTP網(wǎng)站關(guān)聯(lián)的WAP網(wǎng)站
- 基于網(wǎng)站指紋推送白名單的方法及系統(tǒng)
- 網(wǎng)站漏洞檢測(cè)方法和系統(tǒng)
- 一種網(wǎng)站建立方法、裝置及計(jì)算設(shè)備
- 一種網(wǎng)站識(shí)別方法及裝置
- 網(wǎng)站風(fēng)險(xiǎn)評(píng)估方法及裝置
- 網(wǎng)站版權(quán)時(shí)間的管理方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 一種網(wǎng)站開(kāi)發(fā)系統(tǒng)及方法
- 一種基于網(wǎng)站地圖的指紋識(shí)別方法
- 網(wǎng)站應(yīng)用框架指紋識(shí)別的方法、設(shè)備、裝置及介質(zhì)





