[發(fā)明專利]一種網(wǎng)頁中的暗鏈的檢測方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710537982.1 | 申請(qǐng)日: | 2017-07-04 |
| 公開(公告)號(hào): | CN108363711B | 公開(公告)日: | 2020-11-13 |
| 發(fā)明(設(shè)計(jì))人: | 馬森 | 申請(qǐng)(專利權(quán))人: | 北京安天網(wǎng)絡(luò)安全技術(shù)有限公司 |
| 主分類號(hào): | G06F16/955 | 分類號(hào): | G06F16/955 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100195 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)頁 中的 檢測 方法 裝置 | ||
本發(fā)明實(shí)施例提供了一種網(wǎng)頁中的暗鏈的檢測方法和裝置,用以解決現(xiàn)有的暗鏈檢測方法需要定期更新規(guī)則的問題。該方法包括:訪問目標(biāo)網(wǎng)頁;根據(jù)目標(biāo)網(wǎng)頁所屬站點(diǎn)的主機(jī)返回的結(jié)果確定目標(biāo)網(wǎng)頁中的鏈接;查找所述目標(biāo)網(wǎng)頁中的鏈接中的外鏈;在返回結(jié)果中查找到的外鏈的位置設(shè)置與所述目標(biāo)網(wǎng)頁上的內(nèi)容不同的標(biāo)記,并生成頁面;其中,不同的外鏈的位置設(shè)置的標(biāo)記不同;將生成的頁面轉(zhuǎn)換為圖片,識(shí)別所述圖片中的標(biāo)記;確定未被發(fā)現(xiàn)的標(biāo)記所處的位置的外鏈為暗鏈。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)安全技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)頁中的暗鏈的檢測方法和裝置。
背景技術(shù)
“暗鏈”是一種搜索引擎優(yōu)化的手段,用于提高它所指向的網(wǎng)站的搜索排名,是最有效的搜索引擎優(yōu)化(SEO,Search Engine Optimization)方法之一。“暗鏈”正如它的名字所描述的一樣,是一種在網(wǎng)頁頁面上不可見或極易被忽視的超鏈接,并盡量不去破壞網(wǎng)頁原有的結(jié)構(gòu)。在網(wǎng)站頁面被攻擊成功后,被插入暗鏈的可能性很大,這會(huì)給網(wǎng)站帶來負(fù)面影響,過大的負(fù)面影響可能會(huì)帶來嚴(yán)重的經(jīng)濟(jì)損失,同時(shí)當(dāng)暗鏈被搜索引擎發(fā)現(xiàn)時(shí),會(huì)降低被插入暗鏈的頁面的搜索排名。
目前市場上有專門監(jiān)控網(wǎng)頁上的暗鏈的產(chǎn)品,但是,這些產(chǎn)品所用的技術(shù)主要是監(jiān)控非授權(quán)用戶篡改頁面,或者是將網(wǎng)頁上的外鏈與預(yù)設(shè)規(guī)則進(jìn)行比對(duì)來分辨網(wǎng)頁上的外鏈中的暗鏈。這些檢測方式是滯后的,并且需要定期更新規(guī)則。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種網(wǎng)頁中的暗鏈的檢測方法和裝置,用以解決現(xiàn)有的暗鏈檢測方法需要定期更新規(guī)則的問題。
基于上述問題,本發(fā)明實(shí)施例提供的一種網(wǎng)頁中的暗鏈的檢測方法,包括:
訪問目標(biāo)網(wǎng)頁;
根據(jù)目標(biāo)網(wǎng)頁所屬站點(diǎn)的主機(jī)返回的結(jié)果確定目標(biāo)網(wǎng)頁中的鏈接;
查找所述目標(biāo)網(wǎng)頁中的鏈接中的外鏈;
在返回結(jié)果中查找到的外鏈的位置設(shè)置與所述目標(biāo)網(wǎng)頁上的內(nèi)容不同的標(biāo)記,并生成頁面;其中,不同的外鏈的位置設(shè)置的標(biāo)記不同;
將生成的頁面轉(zhuǎn)換為圖片,識(shí)別所述圖片中的標(biāo)記;
確定未被發(fā)現(xiàn)的標(biāo)記所處的位置的外鏈為暗鏈。
可選地,根據(jù)目標(biāo)網(wǎng)頁所屬站點(diǎn)的主機(jī)返回的結(jié)果確定目標(biāo)網(wǎng)頁中的鏈接,包括:
將目標(biāo)網(wǎng)頁所屬站點(diǎn)的主機(jī)返回的結(jié)果中的超文本標(biāo)記語言HTML文件和Javascript腳本文件均與層疊式樣式表CSS文件進(jìn)行渲染,并根據(jù)渲染的結(jié)果確定目標(biāo)網(wǎng)頁中的鏈接。
可選地,查找所述目標(biāo)網(wǎng)頁中的鏈接中的外鏈,包括:
確定所述目標(biāo)網(wǎng)頁中的a標(biāo)簽的href屬性與目標(biāo)網(wǎng)頁所屬站點(diǎn)的主機(jī)不同的對(duì)象,為所述目標(biāo)網(wǎng)頁中的鏈接中的外鏈。
可選地,根據(jù)以下步驟為查找到的各個(gè)外鏈生成與所述目標(biāo)網(wǎng)頁上的內(nèi)容不同的標(biāo)記,并且為查找到的各個(gè)外鏈生成的標(biāo)記各不相同;
生成消息摘要算法第五版MD5值;
重復(fù)執(zhí)行判斷所述目標(biāo)網(wǎng)頁中是否存在最新生成的MD5值的步驟,和在最新生成的MD5值存在于所述目標(biāo)網(wǎng)頁中時(shí)對(duì)最新生成的MD5值再次求MD5值的步驟,直至最新生成的MD5值不存在于所述目標(biāo)網(wǎng)頁中;
在目標(biāo)網(wǎng)頁中不存在最新生成的MD5值后,將目標(biāo)網(wǎng)頁中不存在的MD5值作為基礎(chǔ)MD5值,在基礎(chǔ)MD5值中分別加入n-1個(gè)不同的字符或者數(shù)字,生成目標(biāo)網(wǎng)頁中不存在的,n-1個(gè)不同的MD5值;其中,n為所述目標(biāo)網(wǎng)頁中的外鏈的個(gè)數(shù)。
可選地,根據(jù)以下步驟為查找到的各個(gè)外鏈生成與所述目標(biāo)網(wǎng)頁上的內(nèi)容不同的標(biāo)記,并且為查找到的各個(gè)外鏈生成的標(biāo)記各不相同;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京安天網(wǎng)絡(luò)安全技術(shù)有限公司,未經(jīng)北京安天網(wǎng)絡(luò)安全技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710537982.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





